首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
6229
篇文章
累计创建
2579
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
AI大模型评测
相关的文章
2026-02-20
AI生成内容泛滥,网友造新词“AI;DR”调侃劣质AI垃圾
当前互联网上充斥着大量由AI生成的劣质内容,引发了用户不满。有网友创造了新词“AI;DR”(AI, didn't read,AI生成,懒得看)来指代和调侃这些低质量信息,该词是经典网络用语TL;DR(太长不看)的戏仿。这一现象反映出公众对AI内容质量的反感和抵制情绪正在升温,甚至有程序员认为,将写作外包给大语言模型是对思考和理解的亵渎。此举表明用户不再容忍未经审校的AI生成垃圾,正积极寻找方法进行区分和标记。
2026-02-20
3
0
0
AI新闻/评测
AI工具应用
2026-02-20
AI领袖齐聚印度拍摄大合照,奥尔特曼、阿莫代伊却“貌合神离”
全球人工智能领域领军人物近期齐聚印度新德里参加AI影响力峰会,与印度总理莫迪共同拍摄了一张引人注目的合照。然而,合照中OpenAI CEO萨姆·奥尔特曼与Anthropic CEO达里奥·阿莫代伊未曾握手,这一细节迅速成为焦点。两人的“貌合神离”被认为与其近期在AI广告策略上的公开“交锋”有关,特别是Anthropic调侃OpenAI引入广告的做法,引发了奥尔特曼的强烈回应。此次峰会聚焦模型迭代与社会影响,却被这场微小的互动抢了风头,凸显了AI行业内部的竞争态势。
2026-02-20
2
0
0
AI新闻/评测
AI行业应用
2026-02-19
深度解析:为什么人工智能无法理解“真实”世界?
2026-02-19
2
0
0
AI基础/开发
AI新闻/评测
2026-02-19
谷歌Gemini 1.5 Pro:突破性新模型能处理超长文本和代码库
谷歌发布的Gemini 1.5 Pro人工智能模型,以其超大上下文窗口处理能力引发业界关注。该模型能够一次性输入并分析长达100万个标记的文本、代码库甚至数小时的视频内容,这是当前主流大模型处理能力的巨大飞跃。Gemini 1.5 Pro在保持高准确性的同时,展现出强大的跨模态理解和推理能力。这一突破性进展有望彻底改变开发者、研究人员和企业利用AI处理复杂、海量信息的方式,为更深入的知识提取和应用场景奠定基础。
2026-02-19
1
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2026-02-19
谷歌DeepMind想知道聊天机器人是否只是在进行“道德姿态”
随着大型语言模型(LLM)承担更敏感的角色,谷歌DeepMind呼吁对其道德行为进行严格审查。研究人员指出,目前的模型在处理道德问题时表现出的能力可能是表面的“道德姿态”,而非真正的道德推理。本文探讨了如何通过更严格的测试来评估LLM的道德稳健性,并讨论了跨文化价值观的挑战。
2026-02-19
3
0
0
AI新闻/评测
AI基础/开发
2026-02-19
评估AI智能体:亚马逊构建智能体系统过程中的实战经验教训
本文深入探讨了从以LLM为驱动的应用向<em>智能体AI系统</em>的转变,并分享了亚马逊在构建和部署智能体系统时积累的实战经验。文章提出了一个全面的评估框架,包括自动化评估工作流和评估库,覆盖了从底层模型到最终输出的多个层次,旨在系统性地衡量和改进复杂智能体应用的性能与可靠性。
2026-02-19
2
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2026-02-18
OpenAI 正在淘汰其 4o 模型,中国的 ChatGPT 粉丝们并不买账
OpenAI 计划于 2 月 13 日下架其广受欢迎的 GPT-4o 模型,引发了全球范围内,特别是中国用户的强烈抗议。许多将 GPT-4o 视为情感伴侣的用户对这一决定感到悲痛,认为 4o 更具同理心。本文深入探讨了用户对特定模型的依赖性,以及他们如何组织起来争取保留 4o 的使用权。
2026-02-18
1
0
0
AI新闻/评测
AI工具应用
2026-02-18
通过背景故事集为大型语言模型创建虚拟角色:Anthology 方法介绍
本文介绍了Anthology方法,旨在通过生成和利用包含个人价值观和经历等丰富细节的自然传记,引导大型语言模型(LLMs)生成具有代表性、一致性和多样性的虚拟角色。Anthology通过细致的背景故事来模拟个体人类样本,在公共意见调查等场景中表现出更接近真实人类的拟合效果,为用户研究和社会科学提供了新的、可扩展的替代方案。
2026-02-18
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2026-02-18
Anthropic 发布 Sonnet 4.6
Anthropic 遵循其四个月的更新周期,发布了其中型模型 Sonnet 的新版本 4.6。新模型在编码、指令遵循和计算机使用方面有所改进,并将成为免费和专业版用户的默认模型。Sonnet 4.6 的测试版将提供 100 万个 token 的上下文窗口,性能基准测试创下新高。
2026-02-18
1
0
0
AI新闻/评测
AI基础/开发
2026-02-18
OpenAI 正在淘汰其 4o 模型,中国的 ChatGPT 粉丝们无法接受
OpenAI 决定在 2 月 13 日下架其深受喜爱的 GPT-4o 模型,引发了全球,尤其是中国用户的强烈抗议。许多用户将 4o 视为情感伴侣,其离去让他们深感失落。本文探讨了用户对特定模型的深厚情感依赖,以及他们为保留这款“更具人情味”的 AI 伴侣所做的努力。
2026-02-18
2
0
0
AI新闻/评测
AI工具应用
2026-02-18
LinqAlpha如何使用Amazon Bedrock上的“魔鬼代言人”评估投资论点
本文介绍了LinqAlpha如何利用Amazon Bedrock构建其“魔鬼代言人”(Devil’s Advocate)AI研究代理,系统地压力测试投资论点。该系统结合Claude 3.5 Sonnet模型,通过结构化流程,快速找出投资逻辑中的潜在风险和被忽视的假设,帮助机构投资者做出更高信念的决策。
2026-02-18
0
0
0
AI新闻/评测
AI工具应用
AI行业应用
2026-02-18
我对 Abacus AI DeepAgent 的诚实和坦率的评价
2026-02-18
2
0
0
AI基础/开发
AI工具应用
2026-02-18
五大超高速LLM API提供商盘点
2026-02-18
0
0
0
AI基础/开发
AI工具应用
2026-02-18
深度解析:2024年AI大模型技术发展趋势与应用展望
本文深度聚焦2024年AI大模型的技术发展趋势与未来应用展望。我们分析了多模态融合、Agent智能体、长文本处理、以及模型开源与商业化落地等关键领域的新进展,为您揭示AI前沿技术如何重塑行业格局,并提供富有洞察力的前瞻分析。
2026-02-18
2
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2026-02-17
统计近似并非通用人工智能
本文针对Chen等人在评论中提出的观点,即在图灵测试变体等行为测试中的成功是通用人工智能(AGI)的证据,作者提出了三点反驳意见。他们认为,仅仅依靠统计近似能力并不能等同于真正的通用智能,并对当前AGI的定义和评估标准提出了质疑。
2026-02-17
0
0
0
AI新闻/评测
2026-02-12
NVIDIA Nemotron 3 Nano 30B MoE 模型现已在 Amazon SageMaker JumpStart 中提供
我们很高兴地宣布,NVIDIA Nemotron 3 Nano 30B(含3B激活参数)MoE 模型现已在 Amazon SageMaker JumpStart 模型目录中正式发布。开发者无需管理复杂的模型部署,即可利用 SageMaker JumpStart 的托管部署能力,快速在 AWS 上为生成式AI应用提供动力。该模型在编码和推理方面表现出色,支持高达100万个Token的上下文窗口。
2026-02-12
3
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2026-02-12
智谱最新旗舰模型 GLM-5 震撼发布:编程、智能体能力达到开源 SOTA 水平
智谱AI于近日正式发布了新一代旗舰模型 GLM-5,在编程与智能体(Agent)能力方面取得了令人瞩目的开源领域 SOTA(State-of-the-Art)表现。该模型在真实编程场景下的使用体验被评价为与顶尖模型 Claude Opus 4.5 不相上下,特别擅长处理复杂的系统工程和长程Agent任务。据报道,此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”正是GLM-5的代号。目前,用户已可在chat.z.ai平台体验这款强大的AI新星。
2026-02-12
1
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2026-02-10
视觉干草堆:评估大型多模态模型处理长上下文视觉信息的新基准
人类在处理海量视觉信息方面表现出色,这对实现通用人工智能(AGI)至关重要。本文推出了“视觉干草堆”(Visual Haystacks, VHs)基准,旨在严格评估大型多模态模型(LMMs)在处理跨越多张不相关图像时的长上下文视觉检索和推理能力。研究发现当前LMM在视觉干扰、多图推理和信息定位方面存在显著不足,并提出了基于检索增强生成(Visual-RAG)的解决方案MIRAGE。
2026-02-10
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2026-02-10
谷歌 Gemini 1.5 Pro 预览版发布:原生支持 100 万上下文窗口,可处理 1500 页文档或 1 小时视频
谷歌正式推出了下一代 AI 模型 Gemini 1.5 Pro 预览版,该模型最引人注目的升级是其原生支持高达 100 万个上下文 token,在特定情况下甚至可扩展至 200 万 token。这一能力使其能够一次性处理海量信息,例如完整的书籍、11 小时的音频或 1 小时的视频内容,从而极大地提升了 AI 的理解和推理深度。Gemini 1.5 Pro 采用了新的 Mixture-of-Experts (MoE) 架构,在保持高性能的同时,显著提高了推理效率和速度,为开发者和企业带来了更...
2026-02-10
1
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2026-02-10
使用自动化推理检查重写聊天机器人参考实现
本文介绍了新的开源聊天机器人参考实现,该实现利用<em>自动化推理检查</em>(Automated Reasoning checks)的反馈来迭代和重写生成内容。该方案通过<em>数学证明</em>验证答案的正确性,显著提高了准确性和透明度,并提供可审计的解释日志。
2026-02-10
2
0
0
AI新闻/评测
AI基础/开发
AI工具应用
1
2
3
4
5
...
18