首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
2598
篇文章
累计创建
886
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
多模态
相关的文章
2025-12-03
英伟达携手Mistral AI加速新一代开放模型系列
Mistral AI发布了全新的Mistral 3系列开源多语言、多模态模型,并在英伟达的超级计算和边缘平台上进行了优化。该系列包括前沿级到紧凑型模型,旨在通过混合专家(MoE)架构,提供行业领先的准确性和效率,实现从云到边缘的分布式智能愿景。
2025-12-03
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-12-03
Mistral推出Mistral 3开源模型家族,缩小与大型AI竞争对手的差距
法国AI初创公司Mistral于周二发布了全新的Mistral 3开源模型家族,共包含10个模型。该系列包括一个具备多模态和多语言能力的前沿模型,以及九个更小、可离线部署和完全定制化的模型。此举旨在证明对于企业应用而言,模型不一定越大越好,并强调通过微调小型模型可以实现超越闭源模型的效率和性能。
2025-12-03
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-11-23
苹果新研究:AI 不听录音,仅凭文本描述即可零样本识别洗碗等 12 种活动
苹果最新研究展示了一种名为“后期多模态传感器融合”的技术,它能使大语言模型(LLM)仅通过分析音频和运动数据的文本描述,就能零样本识别出用户正在进行的 12 种日常活动,如洗碗、烹饪和举重等。该方法巧妙地避开了直接处理原始录音,极大地保护了用户隐私,同时利用 LLM 强大的多模态文本推理能力来整合不同来源的信息。研究表明,即使在无示例训练下,LLM 的活动识别准确率也远超随机水平,为未来在 Apple Watch 等设备上开发高效、注重隐私的 AI 应用奠定了基础。
2025-11-23
0
0
0
AI基础/开发
AI工具应用
2025-11-20
Google Gemini 3 震撼发布:AI 融入生活,从语音到多模态的飞跃
Google 正式推出了革命性的 Gemini 3 系列模型,标志着人工智能进入与人类生活深度融合的新阶段。Gemini 3 不仅在传统文本处理上能力显著提升,更在语音理解和多模态交互方面实现了跨越式进步。新模型在复杂推理和实时响应方面表现出色,预计将重塑搜索引擎、智能助手及内容创作的体验。此次发布凸显了 Google 在构建通用人工智能方面的持续投入,为开发者和用户带来了更强大、更自然的 AI 交互工具。
2025-11-20
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-11-19
下一代机器人峰会:实现通用具身智能的关键技术与应用前景
在近期举行的下一代机器人峰会上,业界专家聚焦于实现通用具身智能(Embodied AI)所面临的关键技术挑战和广阔应用前景。峰会强调,通用机器人需要突破当前任务特定性强的局限,通过多模态学习、更强的世界模型和高保真度模拟环境来构建鲁棒的感知、推理与操作能力。与会者普遍认为,具身智能是实现真正通用人工智能(AGI)的重要路径,未来将在工业制造、服务业乃至家庭场景中发挥颠覆性作用,驱动新一轮产业升级。
2025-11-19
0
0
0
AI基础/开发
AI行业应用
2025-11-12
MMCTAgent:使AI能够在大型视频和图像集合上进行多模态推理
微软研究院推出了MMCTAgent,一种创新的多模态推理代理,能够高效地在海量视频和图像集合上进行复杂查询和分析。该技术结合了检索增强和生成模型的优势,显著提升了AI在处理大规模视觉内容时的推理能力和准确性。
2025-11-12
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-24
AI内容创作平台Hangry完成500万美元A轮融资
AI驱动的内容创作平台Hangry近日宣布成功完成500万美元的A轮融资,本轮融资由知名风险投资基金领投,旨在加速其在AI内容生成领域的研发和市场扩张。Hangry专注于利用尖端生成式AI技术,帮助营销人员和企业快速、高效地创建高质量的多模态内容。此次融资将主要用于增强其核心算法能力,特别是提升内容个性化和跨平台适应性,巩固其在竞争激烈的AI内容工具市场中的领先地位,为用户提供更具创意的解决方案。
2025-10-24
1
0
0
AI创意设计
AI新闻/评测
2025-10-23
AI应用公司LiblibAI完成1.3亿美元B轮融资,加速全球化布局
AI应用公司LiblibAI近期完成了高达1.3亿美元的B轮融资,由红杉中国、CMC资本联合领投,成为今年国内资本市场AI应用赛道最大的一笔融资。该公司在一年内连续完成四轮融资,平台已成为中国最大的多模态模型与创作社区,拥有超过2000万AI创作者。本轮融资将用于加速其全球化布局,并构建全球创作者共创的多模态内容生态。
2025-10-23
0
0
0
AI新闻/评测
AI工具应用
AI创意设计
2025-10-22
OpenAI 推出 ChatGPT Atlas,一个全新的知识引擎平台
OpenAI 发布了其革命性的新平台 ChatGPT Atlas,旨在彻底改变用户访问和利用知识的方式。Atlas 不仅仅是一个聊天机器人,它被定位为一个强大的“知识引擎”,能够深度整合全球实时信息,提供超越传统搜索和问答系统的深度分析与洞察。该平台利用最新的多模态模型和增强的推理能力,使用户能够以更直观、更具协作性的方式处理复杂数据和信息流,标志着人工智能驱动的信息获取进入一个全新的时代。
2025-10-22
1
0
0
AI新闻/评测
AI工具应用
2025-10-22
多模态AI初创公司Fal.ai在40亿美元估值下完成新一轮融资
专为开发者提供图像、视频和音频AI模型的初创公司Fal.ai,在最新一轮融资中获得了超过40亿美元的估值,并筹集了约2.5亿美元资金。本次融资由Kleiner Perkins和Sequoia领投,显示出市场对多模态AI基础设施的强劲需求。Fal.ai的快速增长与其平台上热门应用(如Sora)的普及直接相关。
2025-10-22
1
0
0
AI新闻/评测
AI行业应用
2025-10-18
Reddit 将其 AI 驱动的搜索扩展到 5 种新语言
Reddit 宣布将其人工智能驱动的搜索体验扩展到法语、德语、西班牙语、意大利语和葡萄牙语。此举使得该功能在巴西、法国、德国、西班牙、墨西哥和意大利等国家的用户可用,用户现在可以用这些语言与由 Google AI 模型驱动的 AI 进行问答式互动,旨在提升平台搜索体验和用户留存。
2025-10-18
1
0
0
AI新闻/评测
AI工具应用
AI行业应用
2025-10-16
重磅升级!豆包发布四大模型:支持情感理解、音调风格调节,精准朗读复杂公式
火山引擎在武汉站活动中发布并升级了四款豆包大模型,核心亮点在于语音合成与声音复刻技术的重大突破。豆包大模型1.6新增四档思考长度调节,旗舰版在保持效果的同时,总输出Tokens下降77.5%。新发布的豆包语音合成2.0和声音复刻2.0模型,基于大语言模型研发,实现了对文本的深度语义理解,不仅能精准控制语速、音调和风格,更在小学至高中复杂公式朗读准确率上达到了惊人的90%。此外,轻量级的1.6 lite模型在成本上相较1.5 Pro降低53.3%,为企业应用提供了更具性价比的选择。
2025-10-16
1
0
0
AI新闻/评测
AI基础/开发
AI工具应用