过去70年✿★✿✿,人机交互经历了命令行✿★✿✿、图形界面✿★✿✿、搜索✿★✿✿、推荐到自然交互的多次范式迁移✿★✿✿,每一次迁移背后都对应着底层技术浪潮的变化✿★✿✿。
被动响应——交互式执行——具备提议能力的主动模式✿★✿✿,交互方式从文本扩展到语音如月莉亚✿★✿✿、手势乃至未来的脑机接口✿★✿✿。
计算架构维度已经出现从通用走向专用✿★✿✿、从单一走向多元的趋势✿★✿✿。GPU刺激了深度学习的第一波爆发✿★✿✿,但能耗与成本也不断攀升✿★✿✿。
于是✿★✿✿,性能尊龙凯时人生就是博·(中国)官网✿★✿✿、成本与能效成了大家追逐的新的平衡点✿★✿✿,推理尊龙凯时人生就是博·(中国)官网✿★✿✿、端侧✿★✿✿、强化学习等匹配不同应用任务的专用芯片纷纷涌现✿★✿✿。
最后关于数据——在模拟世界阶段如月莉亚✿★✿✿,数据是静态教材✿★✿✿;在探索世界阶段✿★✿✿,数据是动态反馈✿★✿✿;在归纳世界阶段如月莉亚✿★✿✿,数据是验证假设的证据✿★✿✿。
从人类数据枯竭到合成数据兴起✿★✿✿,再到AI主动探索并获取实验数据✿★✿✿,这背后体现出数据从限制模型能力的约束✿★✿✿,逐步转变为推动AI主动学习的工具✿★✿✿。
此次大会上✿★✿✿,IDEA研究院还宣布了国际先进技术应用推进中心(深圳)与深港高等研究交流中心(SHARE)两个创新平台✿★✿✿,以及一系列创新项目✿★✿✿。
2025 IDEA大会上✿★✿✿,IDEA研究院计算机视觉与机器人研究中心负责人张磊✿★✿✿,首次系统介绍了研究院在具身智能方向的最新成果✿★✿✿:
过去两年如月莉亚✿★✿✿,具身智能异军突起✿★✿✿,不少团队试图通过VLA(视觉-语言-动作)大模型架构✿★✿✿,让机器人像人一样“听得懂人话✿★✿✿,看得懂世界✿★✿✿,动得起来”✿★✿✿。
与其从动作建模着手尊龙凯时人生就是博·(中国)官网✿★✿✿,不如先把“看清楚”这个问题解决得更彻底——这成为了IDEA研究院发力的突破口✿★✿✿。
依托IDEA团队过去在开集目标检测和视觉感知的研究积淀✿★✿✿,以强泛化的视觉检测模型DINO-X为基础尊龙凯时人生就是博·(中国)官网✿★✿✿,IDEA研究院发起了DINO-X Grasp项目
这个模型不仅能够精准识别物体如月莉亚✿★✿✿、预测抓取点位✿★✿✿,还可以结合深度信息✿★✿✿,还原物体的三维结构✿★✿✿,从而指导机械臂完成稳定✿★✿✿、精确的操作✿★✿✿。
现场展示的视频中✿★✿✿,DINO-X Grasp驱动的机器人灵活应对各种形状各异的物品✿★✿✿,从食品包装袋到异形障碍物✿★✿✿,一抓一个准✿★✿✿。
目前✿★✿✿,这套方案已在招商局集团多个子公司应用✿★✿✿,覆盖港口集装箱验残尊龙凯时人生就是博·(中国)官网✿★✿✿、桥梁螺钉检测✿★✿✿、夜间车辆识别等多个复杂场景✿★✿✿。
他所带领的MoonBit团队2022年底才成立✿★✿✿,刚好赶上了ChatGPT横空出世✿★✿✿。张宏波在台上分享时说✿★✿✿:“作为新的编程语言✿★✿✿,(赶上这个时间点)✿★✿✿,可以让我们有机会重新思考在AI时代下怎么做开发者工具如月莉亚✿★✿✿。”
过去一年半✿★✿✿,MoonBit从一门支持多后端的编程语言✿★✿✿,逐步演进为完整的全栈工具链(包含专为AI设计的原生工具集)✿★✿✿,最终构建起集开发者工具链与智能体开发生态于一体的开发者平台✿★✿✿。
张宏波透露✿★✿✿,MoonBit已经有了商业付费客户✿★✿✿,包括北美的云厂商用它来进行服务器开发✿★✿✿。”大部分编程语言在前四年✿★✿✿、前五年都是默默无闻的✿★✿✿,而我们在这么早的阶段就累积了这么多用户✿★✿✿。”
目前✿★✿✿,MoonBit的用户从去年的2.6万到现在超过了10万✿★✿✿。张宏波预计到2026年底会有接近100万用户✿★✿✿,“成为首个从中国走出去的有世界影响力的开源平台”✿★✿✿。
“在电影工业中✿★✿✿,一个镜头通常包含几百个G的数据✿★✿✿。”王嘉平在演示时介绍✿★✿✿,电影工业的渲染和游戏完全不同尊龙凯时人生就是博·(中国)官网✿★✿✿。游戏要求毫秒级响应✿★✿✿,而电影渲染一帧画面可能需要几小时甚至一天✿★✿✿。
原本需要几分钟才能看清的场景图和雄狮形象✿★✿✿,Smaray几秒钟就渲染完成✿★✿✿,而且可以像玩FPS游戏一样在场景中自由探索✿★✿✿。
目前✿★✿✿,《流浪地球》特效制作方MoreVFX✿★✿✿、《哪吒》制作方光线动画等顶级公司已经开始使用Smaray✿★✿✿。节水尊龙人生就是博✿★✿✿,珠江✿★✿✿。尊龙凯时人生就是博!✿★✿✿,水力发电✿★✿✿,