看视频画运动想像识别!的多模态工业大模型太能干了算法cad电信号

今年升级的重点在于引入了多模态大模型能力。

当 Sora 和 Suno 所创造的视频和音乐作品在全球范围内引起视听革命时,工业领域的大规模多模态应用又将如何演进?3 月 27 日,作为中国领先的「AI+制造」解决方案提供商,创新奇智揭开了他们的前瞻性答案。

经过半年努力,创新奇智在北京举办的发布会上发布了更为强大的奇智孔明工业大模型 2.0 版本( AInno-75B ),几款大模型原生应用也首次亮相,包括 ChatVision 、ChatCAD,ChatRobot 也升级到 Pro 版本 。

Scaling laws 的发现有助于研究人员和工程师们预测增加模型规模所带来的性能收益,以及为了达到特定性能目标需要的参数数量。如今业界已经形成一些共识,参数的提升可以让模型性能提升。较之 AInno-15B ,AInno-75B 在规模和性能方面取得了显著增长。

今年升级的重点在于引入了多模态大模型能力。张发恩解释说,这个进阶的大模型能够处理包括文本、图片、视频在内的多种信息模态,甚至能够融合工业场景中特有的数据类型,比如 CAD 图纸和 EEG 信号。它的输出同样多样,能够生成文本、图像、视频、CAD 设计图或者具体操作行为。

一、ChatCAD: 工业“文生图”之美

C端AIGC应用生成的图片、视频作品令人叹为观止,而在企业服务领域,AI生成能力同样精彩。

工业设计是生产活动的基石,从手机到新能源汽车工厂,生产建造前都须完成工业设计。CAD软件作为工业设计之本,在产业链上游占据重要地位。长期以来,我国传统CAD软件市场被国外厂商把持,界面复杂、使用门槛高。

中国中元国际机械工程有限公司经营总负责人王先透露,他们的设计工作大多依赖人工。一个单体建筑,无论是标准层还是综合体都需要设计师一笔一笔绘制,工业图纸亦是如此,耗费大量人力物力。此外,行业规范众多且修订频繁,进一步加大了设计难度。

为打破这一局面,创新奇智率先将工业大模型技术引入工业设计领域,推出Text-to-CAD类应用—“ChatCAD”:通过简单的对话问答形式,便能迅速理解设计师的创意意图,自动生成符合要求的工业设计图,并支持导出到传统软件进行微调。

输入 “帮我设计一个工业滑轮,参数如下:滑轮半径为6,厚度为5,滑轮边缘向外突出0.8,突出部分厚度为0.5,滑轮中心轴高度为5,半径为4” 。ChatCAD 立刻生成作品,并根据反馈不断优化设计。

即使面对冗长复杂的部件设计需求,ChatCAD也能应对。例如,“帮我设计一个涡轮机,涡轮由电机、引擎罩组成,具体要求如下:电机为圆柱形,长20,直径16。涡轮由一个圆柱涡轮轴和5片扇叶组成,涡轮轴长20,直径12,涡轮顶部要有圆柱形圆锥旋转轴,轴帽长度为9,直径12,引擎罩直径50,长度30,涡轮扇叶与引擎罩之间的间隔为1。”

ChatCAD 依然可以生成结果,并根据反馈持续完善。ChatCAD生成的设计还支持主流文件格式,可无缝对接其他工业软件,方便后续集成修改。

这一功能令王先倍感振奋。他认为,ChatCAD 有望帮助行业减少重复性劳动,规避硬性规范限制,进而影响整个行业的人工报价。

那么,ChatCAD 是如何实现的?张发恩解释道,CAD 有别于文本、图片、视频等常见模态,它需要表示点、线、边、圆、柱、工艺等几何数据。“所以我们也叫做一种模态,是 C 端不具备的一种模态。我们要发明自己表达 CAD 的中间语言,大模型生成这种中间语言或者中间码,再把这些中间码翻译成 CAD 。”

张发恩坦言,目前 ChatCAD 生成的简单图纸可直接用于加工,但复杂设计仍需完善。ChatCAD 的目标是成为设计院工程师的得力助手。它有望将原本耗时十小时的设计流程缩短至一小时,大模型负责完成 90% 的工作,剩余 10% 由人工优化。

值得一提的是,创新奇智已成功将先进的大模型技术深度融入 CAD 、MES 、BI 等多种工业软件,实现了对"研发设计-生产控制-信息管理"全流程的智能化改造与升级。

二、ChatVision :工业安全监管新利器

工厂生产安全与合规至关重要,视频监控和图像分析不可或缺。以板卡厂波峰焊为例,工人清理 280 度高温锡炉时,若未严格佩戴安全防护装备,如气密式活性炭口罩、高温防护手套等,存在严重烫伤风险。

传统监控方式效率低下,容易遗漏隐患,事后检查滞后明显。ChatVision 基于 Alnno-75B 工业大模型,可通过自然语言实时分析监控视频流、视频文件和图片,精准识别不合规行为,并立即触发报警系统(比如自动发送邮件给管理员),助力工业企业安全生产。

发布会现场演示中,ChatVision 准确响应"仔细观察当前画面,告诉我这可能是个什么地方"等综合理解指令,以及"找出画面中的电源插座"、"找出白色的安全帽"等具体目标识别任务,展现了其广阔应用前景。

这些指令看似很简单,没有大模型的情况下需要针对每个细小的识别类别(比如安全帽、吸烟)开发具体算法,调试部署后难以修改,落地成本高、周期长。大模型的出现颠覆了传统范式,单个大模型可覆盖多个小模型的功能,在性能、准确率、泛化能力等方面全面超越,并支持自然语言交互,大大简化了开发部署流程。

现场演示中,画面发生变化:一位同事摘下工帽玩手机,另一位同事脱下安全衣。演示人员下达指令:"请仔细分析这个画面,如果有违规,发邮件给管理员"。

这条指令知识密度很高,不仅涉及违规判断,还需决定是否触发邮件发送以及收件人。这正是大模型原生应用的典型服务模式。结果,ChatVision 调用了后台很多安全监测技能做了识别,不仅标出来三项违规之处,还发送了邮件,附带截图。

ChatVision 演示充分体现了工业大模型的规划和推理能力。它可以将用户意图转化为一系列外部工具调用,有条不紊地完成复杂视频理解任务。

创新奇智 CTO 张发恩表示,过去几年公司积累了 200 多项视觉算法和模型资产,而工业大模型为这些资产的应用开辟了新天地。大模型不仅可以充当智能编排者,优化用户体验,其多模态能力还能强化视频理解,在企业安全领域大显身手。

最后一个演示案例凸显了大模型在多模态领域的前沿应用。面对一段真实车间视频,演示人员提出高难度需求:"请仔细分析这个视频,告诉我是否有人吃饭并标识这个动作发生的时间"。该任务需要大模型对长时间序列画面进行连续动作识别,并标注动作起止时间。结果, ChatVision 准确定位到视频开头 15 秒内出现工人吃饭的情况。

"吃饭是很常见的事件,大模型对事件的理解能力远胜传统小算法模型。"张发恩解释道。长期以来,通过视频保障生产和工程安全的需求十分迫切。未来,围绕大模型开展相关工作,将有望实现生产安全状况、生产过程合规性的智能视频理解。

在王先看来,安全始终是工程项目的头等大事。多年来,工程安全培训很少涉及现场隐患排查。他认为 ChatVision 的应用前景广阔,现场安全头盔检测、高空安全绳佩戴、安全器具携带等场景都可望落地。ChatVision 在监理行业也大有可为,目前许多现场安全巡检仍高度依赖人力。

三、ChatRobot Pro :“运动想像识别”

AInno-15B 的原生应用 ChatRobot 已经实现语音控制工业机器人。直接告诉ChatRobot “给我来一杯咖啡”,它就可以指挥工业机械臂在货架上寻找咖啡,自行设计路线把货物送到你手上。ChatRobot Pro 能处理更复杂的信息载体脑电信号。

发布会上,演示人员随机选择了一种商品(统一绿茶),让一位头皮上固定了多个电极的人用运动想像控制工业机器人将饮料交到其手中。这位头戴采集器的人努力想着三件事:向左、向右,选中,光标根据大模型翻译出来的信号也在屏幕上左右移动。当光标移到目标图标时,他会盯着这个图标不动,光标点击选中。

接下来,ChatRobot Pro 会自主完成任务的智能编排,生成可执行任务步骤,并与工业机器人接口实时交互,指示机器人完成任务。

脑电信号是大脑活动时产生的信号,大脑活动和脑电信号之间的关系非常复杂,如何解码成为困扰研究者的一大难题。传统做法的准确率低,AInno-75B 展现出解读这类多模态信息的潜力。国外一些脑机接口技术使用侵入式电极获得脑电信号,它涉及到电极设计、手术植入、排异反应、信号传输、信号解码等一系列工程问题。创新奇智使用非侵入式脑电帽收集脑电信息,在工程难度上大大降低。

不过,张发恩也表示,侵入式可以获得更多通道和更清晰的脑电信号,为后续解码更复杂大脑意图带来方便。一个形象的比喻是:侵入式采集脑电信号就像在体育馆内部听演唱会,非侵入式则像在体育馆外听演唱会,歌声的清晰度会有很大的区别。当前,创新奇智在做的研发工作,是验证工业大模型的多模态能力,为未来可能的脑控工业自动化场景进行技术预研。

这也是一个端到端的原生应用,张发恩强调。从脑电信号输入到直接输出最终结果(机械臂将货物递给演示人员)的整个流程都由神经网络来完成,而不依赖于手工设计的特征或传统的数据处理。

除了自然语言交互和运动想像识别,ChatRobot Pro 也充分利用了工业大模型推理能力,实现了长序列任务编排和复杂决策驱动。赋予不同具身(无论是工业机械臂还是 AGV 等)强大的智能操控和决策能力,也会是创新奇智工业大模型未来努力的方向。

四、继续进化,笃行向前

生成式AI时代,工业应用尚无先例可循,创新奇智一直在探索工业场景下的种种可能。

大模型在企业服务方向上的前景,张发恩称之为 “Promising”。但他坦言,技术变革的窗口期,大家的认知往往参差不齐,尤其是比较大的变革,人的认知需要时间跟进,自己也不例外。

除了新增的原生应用,去年发布的 ChatDOC 整体性能和效果都有提升,产品功能更加完善。ChatBI 新增支持 Excel 和 CSV 数据,现在生成 SQL 语句和分析报告的准确率提升 15%。大模型服务引擎部署起来更容易,推理性能更高。

“创新奇智会进一步将直接基于工业大模型核心生成能力搭建的 ChatX 应用打磨好。”张发恩说。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END
0.中国机器人之父蒋新松的故事☃️2025年8月,世界机器人大会在北京举行,大会人气爆棚,人山人海,吸引了全球的目光。在这热闹的时刻,让我们想起了“中国机器人之父”蒋新松。 蒋新松院士是中国机器人事业的奠基者,他以战略眼光和开拓精神,带领中国在机器人领域实现从无到有的突破,其贡献深刻影响了中国科技发展进程。 1996年,蒋新松获得中国工程院首届工程科技奖。 jvzquC41yy}/onnrkct/ew47hknftAo
1.46个对人类影响深远的发明,中国人贡献了3个!这台机器是专门为 诸如汽车等重型工业的 生产而设计的 是一台实用性很强的机器人 随后 英格伯格和德沃尔 成立了尤尼梅逊公司 开始了“万能自动” 工业机器人的生产 英格伯格 也因此被称为 “工业机器人之父” 25 二维码 (日本) 二维码 又称 二维条码 jvzq<84yyy4489iqe0ipo8hqpvkov87312813868176:8>>2a;<13?78454tj}rn
2.机器人制造工厂的话(机器人生产厂)一门包装在线1959年,德沃尔与美国发明家约瑟夫·英格伯格联手制造出第一台工业机器人。随后,成立了世界上第一家机器人制造工厂——Unimation公司。由于英格伯格对工业机器人的研发和宣传,他也被称为“工业机器人之父”。 1962年,美国AMF公司生产出“VERSTRAN”(意思是万能搬运),与Unimation公司生产的Unimate一样成为真正商业化的jvzquC41yy}/{rrgp0tfv8ftvkimg8634:;/j}rn
3.揽客冲咖啡打乒乓球…高通5G技术让机器人化身“服务达人”1983年,正当工业机器人销量随着现代工业革命的推进水涨船高之际,被誉为“机器人之父”的恩格尔伯格先生和他的同事们却做出了一项惊人的决定,毅然决然将亲手创立并研制出世界上第一台工业机器人的Unimation公司以1.07亿美元的价格转让给了西屋公司,由此退出了工业机器人行业。 jvzquC41pg}t0v~ftk|ft|3eqo521@:;19;:3<<0jvs
4.陕西开放大学25秋机器人工程概论形考任务一参考答案陕西开放大学25秋机器人工程概论形考任务一 参考答案形考任务一试卷总分:100 得分:100 1.1971年,美国机器人专家乔治·德沃尔制造出了世界第一台工业机器人——Unimate机器人,对机器人工业作出了杰出的贡献,因此被称为“工业机器人之父”。 2.美国 作业答案联系QQ:3064302332 jvzq<84yyy4zq~}wg361h7hqo1wjvj4424;.3:225/7:3B<0jvsm
5.对人类影响深远的44个发明,你只知道“四大发明”?机械臂上,有一个可以任意伸缩的小机械臂,小机械臂的末端,设有一个可以做仰俯、侧摇动作的圆盘。这台机器是专门为诸如汽车等重型工业的生产而设计的,是一台实用性很强的机器人。随后,英格伯格和德沃尔成立了尤尼梅逊公司,开始了“万能自动”工业机器人的生产。英格伯格也因此被称为“工业机器人之父”。jvzq<84yyy4489iqe0ipo8hqpvkov8751293786:16967:<79a719<:98;>80|mvon
6.从技术创新看机器人产业形成及发展.pdf器人得到迅速发展,至今已形成??独立的学科——机器人学;同时形成一个新兴产业——机器人制造业。字计算机“旋风”问世。电子计算机的出现及其以后迅速的发展对机器人技术的发展起到了关键的作用。近几十年来,随着各国对机器人的研究和开发,工业机.华东师范大学硕十论文? 第二章机器人产业概述逊”公司???ㄐ蜕??饶jvzquC41oc~/dxtm33>/exr1jvsm1;5391654?4324;46<870unuo
7.机器人发展史(公元前1400公元2015年),2045年有望超越人类德沃尔与美国发明家约瑟夫·英格伯格联手制造出第一台工业机器人。随后,成立了世界上第一家机器人制造工厂——Unimation公司。由于英格伯格对工业机器人的研发和宣传,他也被称为“工业机器人之父”。 22.第一台正在商业化工业机器人问世,随后进行改进,1962年 jvzquC41yy}/oniuek4dp8ftvkimg8xjqyebt}neng4eqHnf?:743>>8g;gd
8.进化十多年,四足机器人的商业化之路还有多长?|机器人|波士顿动力若要回溯四足机器人行业的历史,必然绕不开波士顿动力这家公司。 波士顿动力的创始人Marc Raibert(马克·雷伯特)被业内称为“机器狗之父”。 早在1986年,博士毕业于麻省理工学院(MIT)的他就开发出了第一台能够奔跑和行走的动态稳定四足机器人。 在此之前,四足机器人多为静态稳定系统,许多研究者大多先研究机器人的jvzq<84m0uooc7hqo0io1jwvkerfa@::47?3:@:a3e9g7;k8d27:2:|;5i4ivvq
9.爆款市场占有率连续三年第一,济宁机器人产业为啥频现“小巨人专用车、工业机器人,两个颇有违和感的行业,如今在梁山做得风生水起。成立18年的山东水泊焊割设备制造有限公司(以下简称水泊焊割),不仅异军突起,而且成为行业翘楚,其专用车栏板智能焊接生产线在国内市场占有率连续三年第一。除了水泊焊割,珞石(山东)智能科技有限公司、山东天河科技股份有限公司也是专精特新“小巨人”企业jvzquC41lktjpp3kskrv0lto1ltzcx|gp1814;4262:07:5286=/uqyon
10.西门子、施耐德、三菱、ABB等全球工业巨头的数字化拓疆之旅值得注意的是,2019年ABB对战略方向进行了重大调整,以110亿美元的估值剥离电网业务出售给日立集团,并对现有四大事业部进行重组,将业务划分成电气、工业自动化、机器人及离散自动化以及运动控制四大事业部,更加聚焦于数字化行业发展。 艾默生:深耕行业提供智能制造解决方案 jvzquC41yy}/uqfpi{kykwjk0ipo8ftvkimg8:22;8177mvon
11.从启蒙到智能,工业机器人60年的“开挂人生”1958年,被誉为“工业机器人之父”的约瑟夫·恩格尔伯格(Joseph F·Engelberger)创建了世界上第一个机器人公司——Unimation(Univeral Automation)公司,并设计和制造出第一台Unimate机器人。这是一台用于压铸的五轴液压驱动机器人,手臂的控制由一台计算机完成,它的出现给世界带来了惊奇:通过采用分离式固体数控元件,并装jvzquC41yy}/k‚nqw0ipo8fpcntk|4424:1;;=329>::@
12.人形机器人鼻祖正式退役,但机器人产业正值辉煌据了解,WABOT-1的行动能力约与一岁半的婴儿差不多,尽管行走一步需要45秒,步伐也只有10公分左右,但在当年仍旧足够震惊全世界。其主要作者加藤一郎也因此被誉为“世界仿人机器人之父”。 随后,由日本本田在1986年诞生的ASIMO被视为第二代人形机器人中的佼佼者。其身高130厘米,体重48公斤,全身57个关节,最大速度jvzquC41yy}/zrfplkiikwf0eqs0uyjekcr0fnyckne66?5850nuou
13.学习“两会”精神奋力推进“一流校”建设我将带领团队,锚定国家2022年发展任务,以双高校建设和世界一流职业院校建设为抓手,全面落实立德树人根本任务,进一步改善工业机器人技术专业职业教育办学条件,探索中德合作产教融合办学体制。充分发挥教育部工业机器人开放式公共实训基地的作用,加快培养制造业高质量发展的急需人才,以实际行动推进高等教育内涵式发展。jvzquC41yy}/uƒnkv0kew7hp1ktgq86258538;60jvs
14.我校师生热议党的二十大报告第十七届“振兴杯”全国青年职业技能大赛(学生组)创新创效专项赛金奖获得者、智能控制学院2020级工业机器人331班朱铮彦 乘风华正茂之东风,砥砺勇毅前行之初心。这是生机勃勃的新时代,这是青春激扬的新时代。作为新时代大学生,我们要以“今日之我胜昨日之我”的朝气,心怀党和人民的事业,笃行历练、淬炼本领、增长才干jvzquC41|u4dkry0gf{/ew44248039691e95:=f327>188ucigs/j}r
15.追逐“中国机器人”梦想——记九三学社河南省委会科技委员会委员这样再把机器人放下水,果然没有再出现进水冒气的问题,大家都松了一口气……就这样,通过课题组共同努力,该项目最终通过了专家鉴定验收,同时获得了黑龙江省科技进步二等奖。 河南是农业大省,也是国家的粮仓。博士后出站后,袁夫彩选择了被誉为粮食行业“黄埔军校”之称的粮食大学——河南工业大学,又开始对机器人关键jvzquC41jgtbp7hjkpg/exr1ujgoiznw1ktgq8724551:;71479189;29:4ivvq
16.田中精机:唯一实锤苹果iRobot项目的人形机器人工业母机田中精机作为苹果机器人最确定的设备供应商,人形机器人工业母机和设备之王,具备标的稀缺性,难以绕开,强度可以类比同样在ai眼镜中具备稀缺性确定性的博士眼镜,想象空间巨大! 部分参考资料: 机械设备-人形机器人系列十一:绕线机深度:电机性能的“定盘星”-广发证券 电机是机器人核心驱动,人形机器人打开新成长——人形机jvzquC41yy}/lrz{cpmpppxjg0ipo8f1;nm4;kwi69