超越"健忘症"的AI:腾讯团队让机器拥有了"侦探级"推理记忆力
这项由腾讯微信AI团队的徐立炎研究员领导、与华南理工大学等机构合作完成的突破性研究发表于2025年8月,论文题为"ComoRAG: A Cognitive-Inspired Memory-Organized RAG f... ...
新加坡团队突破!一张照片秒变4D世界:让静态画面"活"起来的黑科技
这项由新加坡南洋理工大学S-Lab实验室的陈昭曦、刘天启、任嘉维等研究员,以及上海AI实验室的潘亮等专家联合完成的研究,发表于2025年8月的顶级AI会议论文集。研究团队开发出... ...
GPT-5真的实现了空间智能吗?SenseTime团队万亿token实测揭露真相
这项由SenseTime Research(商汤科技研究院)与新加坡南洋理工大学S-Lab实验室联合进行的研究发表于2025年8月,论文首作者包括蔡中港、王玉博、孙庆平等多位核心研究者,通讯... ...
MIT联手斯坦福打造"超级听力"AI:让机器像人耳一样理解声音的奥秘
这项由MIT脑与认知科学系的Greta Tuckute以及斯坦福大学计算机科学系的Klemen Kotar、Daniel L. K. Yamins等研究者共同完成的突破性研究,发表于2025年8月的arXiv预印本... ...
浙江大学团队发明"动作指挥棒":让AI看懂手势就能生成逼真互动视频
这项由浙江大学周晓威教授团队联合湘江实验室、复旦大学、清华大学和深圳大学共同完成的研究发表于2025年8月,论文题目为《Precise Action-to-Video Generation Through V... ...
北京大学重磅推出Lumen:让视频重新打光变得像换背景一样简单
这项由北京大学、昆字节AI以及中科院等多家机构联合开展的研究,于2025年8月发表在计算机视觉领域的顶级会议arXiv上。研究团队由北京大学的曾建树、昆字节AI的刘宇轩和冯雨桐... ...
Hugging Face团队推出SmolLM2:小而精的语言模型如何在大模型时代找到自己的位置
这项由Hugging Face团队完成的研究发表于2025年2月,详细记录了SmolLM2语言模型的完整开发过程。这篇长达25页的技术报告由Loubna Ben Allal、Anton Lozhkov、Elie Bakouc... ...
ByteDance打造AI人物动画新里程碑:OmniHuman让静态照片秒变生动视频
音乐、说话、手势、表情——只需一张照片和一段音频,就能让静态的人物照片瞬间活起来。这听起来像是科幻电影里的情节,但现在已经成为现实。ByteDance的研究团队在2025年6月... ...
阿里巴巴Qwen2.5-VL:让AI看懂世界的新一代视觉语言模型
这项由阿里巴巴集团Qwen团队领导的突破性研究于2025年3月发表,成果详细记录在技术报告《Qwen2.5-VL Technical Report》中。有兴趣深入了解的读者可以通过arXiv:2502.13923v... ...
Meta研究团队推出MLGym:让AI学会做科学研究的"训练场"
在人工智能迅猛发展的今天,一个令人兴奋的问题摆在我们面前:AI能否真正学会像人类科学家一样进行研究工作?Meta公司的研究团队最近给出了一个有趣的答案。他们开发了一个名... ...
Loading...