3个问题与Seyed Sajjadi:如何利用视频分析平台实现学习自动化
Sajjadi是某机构投资的nFlux.ai公司联合创始人兼CEO,他解释了程序监控如何帮助从宇航员到制造商甚至家庭厨师的人类。
编辑注:本次访谈是某中心科学系列文章的最新一期,关注某中心投资企业的产品服务背后的科学。2019年,某机构基金首次投资nflux.ai,2020年参与该公司种子轮融资。
2018年,Seyed Sajjadi在南加州大学攻读计算机科学硕士学位时决定辍学创立nFlux.ai。攻读硕士期间,他还在加州州立大学北岭分校系统工程研究实验室担任项目经理。
在南加州大学,Sajjadi专注于Sigma认知架构系统的开发,研究成果包括与计算机科学教授Paul Rosenbloom等人合著的论文《控制模拟中的合成角色:认知架构与Sigma的案例》,该论文被2018年跨服务/行业培训模拟与教育会议接收。
在系统工程研究实验室,Sajjadi领导90多名工程师和人因研究人员组成的跨学科团队,专注于构建下一代人工智能机器人搜救系统。在此,Sajjadi与同事受漫威电影宇宙中J.A.R.V.I.S.角色启发,开始构思创立nflux.ai,探索人工智能系统如何以积极方式增强人类能力。
某中心科学就认知架构开发挑战、nFlux在制造业的模仿学习聚焦,以及该技术如何最终应用于家庭客户向Sajjadi提出三个问题。
问:什么是视频分析平台?它如何实现所谓的程序监控?
nFlux是首个智能视频分析平台,可自动化从视频片段非结构化数据中学习并生成上下文洞察的过程。目标是通过视频理解的图灵测试——开发能像人类一样回答视频任何问题的理解系统。首个客户是某航天机构,目前正在构建类似《太空漫游》系列中HAL 9000的通用人工智能系统,能够模仿人类思维、行为和行动。
在深空任务中,由于通信存在40分钟延迟,需要能在航天器上理解宇航员行动并提供辅助的智能系统,这就是程序监控的核心创新。通过10-15个样本的极小数据集实现模仿学习,建立计算模型来跟踪程序执行,实时识别偏差(如遗漏螺丝)并发出警报。
平台的关键是从少量视频中学习的能力,通过基础模型提取信号,结合关键活动的先验语义知识(如系绳、钻孔组件等),并从合成数据中识别每步的关键组件(物体、工具)。该方法受人类观看新程序时吸收信息的方式启发:即使未见过使用的物体/工具,也能识别执行的关键活动并推断成功完成程序所需的步骤。
问:nFlux技术如何在制造业应用?
尽管认为机器人已接管制造车间,但72%的制造工作仍由人类完成。美国每天有600万人执行特定程序。系统可实时捕获偏差,作为虚拟教师帮助培训新员工或学习新程序的现有员工。
这对制造商极具价值:缩短生产周期(更快培训员工可节省数百万美元制造时间),提高产品质量(员工培训越好、程序越标准化,缺陷率越低)。技术还有助于捕获"部落知识"——在复杂制造环境中,培训无法通过纸质文档提供,而需要从正确执行程序的视频派生计算模型。
该计算模型可帮助培训新员工,监控工作确保程序正确执行,作为制造劳动力的智能助手。nFlux并非取代劳动力,而是增强其工作,最终减少制造工厂输出高质量产品所需的返工量。
问:某机构基金是投资者。您的计算模型如何与家庭客户相关?
想象在烹饪时,带屏幕的Echo Show 10正在观看操作,如果遗漏成分会发出警报——这就是将程序监控从车间应用到厨房的示例。
今年初,公司获得另一项某航天机构合同支持宇航员健康,这项工作与其他医疗保健场景相关。例如:如果老年人居住在家中或辅助生活设施中,nFlux应用发现未在上午9点按时服药时可发出警报;或根据医生要求每两步行五分钟时,系统识别过去几小时未活动并提醒行走。这些面向消费者的场景补充了商业程序监控方法,可应用于家庭环境。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码