首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
4195
篇文章
累计创建
1543
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
多模态
相关的文章
2026-01-09
AI治理全球化、具身智能化:中央广播电视总台发布2026年人工智能十大趋势
中央广播电视总台联合多家机构发布了2026年人工智能十大趋势,描绘了未来AI发展的关键方向。报告指出,AI治理将趋向全球化合作,同时智能算力规模化和AI应用主流化将成为核心驱动力。特别强调了AI智能体在企业级业务中的规模化部署,以及多模态技术的实用化进展。此外,具身智能化的融合趋势预示着机器人与现实世界的深度交互将加速,为制造业、仓储和家庭服务等领域带来变革性产品。
2026-01-09
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2026-01-09
GigaTime:使用多模态AI生成的虚拟人群扩展肿瘤微环境建模
微软研究院发布创新方法GigaTime,利用多模态AI生成的虚拟人群,实现了肿瘤微环境(TME)模型的空前规模扩展。该技术整合多源数据,生成数百万个逼真TME模型,显著提高了模型泛化能力,加速了罕见病例研究和新疗法筛选,为精准肿瘤学带来革命性突破。
2026-01-09
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2026-01-07
SGE AI 搜索引擎升级:生成式搜索体验全面改进,支持多模态和定制化
谷歌搜索正在进行重大升级,推出SGE(Search Generative Experience)的全面改进版本,旨在提供更直观、更智能的生成式搜索体验。新版本大幅提升了多模态信息的整合能力,用户可以直接在搜索结果中看到图像、视频和文本的综合摘要。此外,SGE引入了“个性化定制”功能,允许用户根据特定偏好和使用场景调整搜索结果的生成方式,提高信息获取的效率和相关性。这些更新标志着谷歌在AI驱动的搜索领域迈出了关键一步,预示着未来搜索引擎将更加注重用户意图的深度理解和结果的个性化呈现。
2026-01-07
0
0
0
AI新闻/评测
AI工具应用
2026-01-06
MMCTAgent:赋能跨大型视频和图像集合的多模态推理
本文介绍了MMCTAgent,一个创新的多模态代理系统,它能够高效地处理和推理跨越海量视频和图像集合。该系统利用了先进的推理能力,旨在解决复杂的多模态数据分析任务,为AI在信息检索和理解方面提供了新的解决方案。
2026-01-06
0
0
0
AI新闻/评测
AI工具应用
2025-12-30
谷歌宣布重大模型更新:Gemini 1.5 Pro性能提升显著
谷歌正式发布了其最新的AI模型Gemini 1.5 Pro,该版本在性能上实现了显著提升,尤其在多模态处理和长上下文理解方面取得了突破性进展。新模型能够处理高达100万个Token,极大地扩展了AI处理复杂信息的能力范围。此次更新不仅优化了推理速度和效率,还加强了模型在代码生成、复杂推理和多模态输入整合方面的表现,为开发者和企业用户带来了更强大的工具支持。
2025-12-30
0
0
0
AI基础/开发
AI新闻/评测
AI工具应用
2025-12-23
使用 Amazon Bedrock 构建用于预测性维护中根本原因诊断的多模态生成式 AI 助手
本文详细介绍了如何利用 Amazon Bedrock 构建一个多模态生成式 AI 助手,该助手专为预测性维护场景设计,能够对设备故障进行根本原因诊断。通过结合文本、图像等多种数据源,AI 助手能更准确地分析问题,加速故障排除,提升工业运维效率。
2025-12-23
0
0
0
AI新闻/评测
AI行业应用
AI工具应用
2025-12-20
Known利用语音AI帮助你进行更多线下约会
初创公司Known的联合创始人Celeste Amadon和Asher Allen,通过一个使用AI预订餐厅的应用,发现了利用语音AI增强用户互动的潜力。他们开发了一个语音驱动的AI入职系统,极大地提升了用户愿意进行线下约会的比例,并在测试中实现了80%的成功率。该公司已获得970万美元融资,旨在解决“孤独流行病”,鼓励用户摆脱滑动模式,进行更真实的面对面交流。
2025-12-20
0
0
0
AI新闻/评测
AI工具应用
2025-12-10
Rivian 正在开发自研人工智能助手
据 TechCrunch 获悉,Rivian 近两年一直在秘密开发自己的人工智能助手,此举独立于其与大众汽车价值数十亿美元的技术合资企业。该助手旨在深度集成所有车辆控制,采用混合软件堆栈,结合了边缘 AI 和云 AI,以实现灵活定制和增强客户信任。
2025-12-10
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-12-10
GigaTime:使用多模态AI生成的虚拟人群扩展肿瘤微环境建模
本文介绍了GigaTime项目,该项目利用多模态AI生成虚拟人群来显著扩展肿瘤微环境(TME)的建模规模。通过集成多种数据源,GigaTime旨在克服传统生物模型在代表性上的局限性,加速个性化癌症治疗的开发和评估。
2025-12-10
0
0
0
AI新闻/评测
AI行业应用
AI相关教程
2025-12-03
英伟达携手Mistral AI加速新一代开放模型系列
Mistral AI发布了全新的Mistral 3系列开源多语言、多模态模型,并在英伟达的超级计算和边缘平台上进行了优化。该系列包括前沿级到紧凑型模型,旨在通过混合专家(MoE)架构,提供行业领先的准确性和效率,实现从云到边缘的分布式智能愿景。
2025-12-03
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-11-23
苹果新研究:AI 不听录音,仅凭文本描述即可零样本识别洗碗等 12 种活动
苹果最新研究展示了一种名为“后期多模态传感器融合”的技术,它能使大语言模型(LLM)仅通过分析音频和运动数据的文本描述,就能零样本识别出用户正在进行的 12 种日常活动,如洗碗、烹饪和举重等。该方法巧妙地避开了直接处理原始录音,极大地保护了用户隐私,同时利用 LLM 强大的多模态文本推理能力来整合不同来源的信息。研究表明,即使在无示例训练下,LLM 的活动识别准确率也远超随机水平,为未来在 Apple Watch 等设备上开发高效、注重隐私的 AI 应用奠定了基础。
2025-11-23
0
0
0
AI基础/开发
AI工具应用
2025-11-20
Google Gemini 3 震撼发布:AI 融入生活,从语音到多模态的飞跃
Google 正式推出了革命性的 Gemini 3 系列模型,标志着人工智能进入与人类生活深度融合的新阶段。Gemini 3 不仅在传统文本处理上能力显著提升,更在语音理解和多模态交互方面实现了跨越式进步。新模型在复杂推理和实时响应方面表现出色,预计将重塑搜索引擎、智能助手及内容创作的体验。此次发布凸显了 Google 在构建通用人工智能方面的持续投入,为开发者和用户带来了更强大、更自然的 AI 交互工具。
2025-11-20
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-11-19
下一代机器人峰会:实现通用具身智能的关键技术与应用前景
在近期举行的下一代机器人峰会上,业界专家聚焦于实现通用具身智能(Embodied AI)所面临的关键技术挑战和广阔应用前景。峰会强调,通用机器人需要突破当前任务特定性强的局限,通过多模态学习、更强的世界模型和高保真度模拟环境来构建鲁棒的感知、推理与操作能力。与会者普遍认为,具身智能是实现真正通用人工智能(AGI)的重要路径,未来将在工业制造、服务业乃至家庭场景中发挥颠覆性作用,驱动新一轮产业升级。
2025-11-19
0
0
0
AI基础/开发
AI行业应用
2025-11-12
MMCTAgent:使AI能够在大型视频和图像集合上进行多模态推理
微软研究院推出了MMCTAgent,一种创新的多模态推理代理,能够高效地在海量视频和图像集合上进行复杂查询和分析。该技术结合了检索增强和生成模型的优势,显著提升了AI在处理大规模视觉内容时的推理能力和准确性。
2025-11-12
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-24
AI内容创作平台Hangry完成500万美元A轮融资
AI驱动的内容创作平台Hangry近日宣布成功完成500万美元的A轮融资,本轮融资由知名风险投资基金领投,旨在加速其在AI内容生成领域的研发和市场扩张。Hangry专注于利用尖端生成式AI技术,帮助营销人员和企业快速、高效地创建高质量的多模态内容。此次融资将主要用于增强其核心算法能力,特别是提升内容个性化和跨平台适应性,巩固其在竞争激烈的AI内容工具市场中的领先地位,为用户提供更具创意的解决方案。
2025-10-24
1
0
0
AI创意设计
AI新闻/评测
2025-10-23
AI应用公司LiblibAI完成1.3亿美元B轮融资,加速全球化布局
AI应用公司LiblibAI近期完成了高达1.3亿美元的B轮融资,由红杉中国、CMC资本联合领投,成为今年国内资本市场AI应用赛道最大的一笔融资。该公司在一年内连续完成四轮融资,平台已成为中国最大的多模态模型与创作社区,拥有超过2000万AI创作者。本轮融资将用于加速其全球化布局,并构建全球创作者共创的多模态内容生态。
2025-10-23
0
0
0
AI新闻/评测
AI工具应用
AI创意设计
2025-10-22
OpenAI 推出 ChatGPT Atlas,一个全新的知识引擎平台
OpenAI 发布了其革命性的新平台 ChatGPT Atlas,旨在彻底改变用户访问和利用知识的方式。Atlas 不仅仅是一个聊天机器人,它被定位为一个强大的“知识引擎”,能够深度整合全球实时信息,提供超越传统搜索和问答系统的深度分析与洞察。该平台利用最新的多模态模型和增强的推理能力,使用户能够以更直观、更具协作性的方式处理复杂数据和信息流,标志着人工智能驱动的信息获取进入一个全新的时代。
2025-10-22
1
0
0
AI新闻/评测
AI工具应用
2025-10-22
多模态AI初创公司Fal.ai在40亿美元估值下完成新一轮融资
专为开发者提供图像、视频和音频AI模型的初创公司Fal.ai,在最新一轮融资中获得了超过40亿美元的估值,并筹集了约2.5亿美元资金。本次融资由Kleiner Perkins和Sequoia领投,显示出市场对多模态AI基础设施的强劲需求。Fal.ai的快速增长与其平台上热门应用(如Sora)的普及直接相关。
2025-10-22
1
0
0
AI新闻/评测
AI行业应用
2025-10-18
Reddit 将其 AI 驱动的搜索扩展到 5 种新语言
Reddit 宣布将其人工智能驱动的搜索体验扩展到法语、德语、西班牙语、意大利语和葡萄牙语。此举使得该功能在巴西、法国、德国、西班牙、墨西哥和意大利等国家的用户可用,用户现在可以用这些语言与由 Google AI 模型驱动的 AI 进行问答式互动,旨在提升平台搜索体验和用户留存。
2025-10-18
1
0
0
AI新闻/评测
AI工具应用
AI行业应用
2025-10-16
重磅升级!豆包发布四大模型:支持情感理解、音调风格调节,精准朗读复杂公式
火山引擎在武汉站活动中发布并升级了四款豆包大模型,核心亮点在于语音合成与声音复刻技术的重大突破。豆包大模型1.6新增四档思考长度调节,旗舰版在保持效果的同时,总输出Tokens下降77.5%。新发布的豆包语音合成2.0和声音复刻2.0模型,基于大语言模型研发,实现了对文本的深度语义理解,不仅能精准控制语速、音调和风格,更在小学至高中复杂公式朗读准确率上达到了惊人的90%。此外,轻量级的1.6 lite模型在成本上相较1.5 Pro降低53.3%,为企业应用提供了更具性价比的选择。
2025-10-16
1
0
0
AI新闻/评测
AI基础/开发
AI工具应用