泷川雅美视频你的位置:果肉系列 > 泷川雅美视频 > 【EVSD-002】JUN女王様の特殊妄想クリニック</a>2008-09-16大洋図書&$wailea87分钟 “AI教母”李飞飞:Sora仍是二维图像,唯有三维空间智能才能杀青AGI|钛媒体AGI独家
【EVSD-002】JUN女王様の特殊妄想クリニック</a>2008-09-16大洋図書&$wailea87分钟 “AI教母”李飞飞:Sora仍是二维图像,唯有三维空间智能才能杀青AGI|钛媒体AGI独家

发布日期:2024-08-06 10:54    点击次数:109

  

【EVSD-002】JUN女王様の特殊妄想クリニック</a>2008-09-16大洋図書&$wailea87分钟 “AI教母”李飞飞:Sora仍是二维图像,唯有三维空间智能才能杀青AGI|钛媒体AGI独家

【EVSD-002】JUN女王様の特殊妄想クリニック2008-09-16大洋図書&$wailea87分钟

163男女性爱

钛媒体App 8月2日音信,日前斯坦福大学举办的Asian American Scholar Forum论坛的一场闭门会上,有着“AI教母”之称的斯坦福大学训导李飞飞对钛媒体App独家示意,尽管好意思国OpenAI公司的Sora模子不错文生视频,但就本色而言,它仍属平面二维模子,莫得三维立体集中武艺,唯有“空间智能”才是AGI畴昔标的。

李飞飞是在针对钛媒体独创东谈主赵何娟建议的对于“空间智能”模子和大语言模子关系的问题询查时,作念出上述恢复。她进一步解说称,当今的大批模子如GPT4o和Gemini 1.5,都依然如故语言类模子,即输入语言,输出语言,固然也有多模态模子,但仍局限于语言,即便有视频,亦然基于二维的平面图像。但畴昔要杀青AGI的要害一环是“空间智能“,需要三维视觉模子。

她以Sora展示的“日本女性走过霓虹能干东京街头”的 AI 视频作念例子。

“如果你但愿算法换个角度,来展现这个女子走过街头的视频,比如把录像机放在女子背后,Sora无法作念到。因为这个模子对于三维宇宙并莫得着实的深远集中。而东谈主类不错在脑海中想象女子背后的状态。”李飞飞示意,“东谈主类不错集中在复杂的环境下若何步履。咱们知谈若何捏取,若何罢休,若何造器具,若何建造城市。压根而言,空间智能是几何花式,是物体间的关系,是三维空间。空间智能是对于开释在三维空间生成(视觉舆图)并推理和霸术步履的武艺。其应用是无为的, 比如用于AR 和VR,用于机器东谈主,App的联想也需要空间智能。”

李飞飞向钛媒体App强调,“当然进化使动物集中三维宇宙,在三维空间生涯、预判并互动。这种武艺已有5.4亿年的漫长历史。当三叶虫第一次在水中看到光,它必须在三维宇宙中‘导航’。如果不成在三维宇宙中‘导航’,它将很快成为其他动物的大餐。跟着进化的推移,动物的空间智能武艺加强。咱们集中花式,咱们集中深度。”

现年48岁的李飞飞,是著明诡计机科学家、好意思国国度工程院院士、好意思国国度医学院院士,而况在好意思国斯坦福大学以东谈主为本的AI研究所担任负责东谈主。她于2009年率领研发的ImageNet图片数据库和视觉识别大赛,对海量图片进行精确标注和分类,推动了诡计机视觉的识别武艺的跳跃,亦然促成 AI 突飞大进发展的要害要素之一。旧年,她公布的VoxPoser成为具身智能(Embodied AI)发展中要害工夫标的。

本年7月,李飞飞创办的AI公司 World Labs告示完成两轮融资,投资方包括a16z(Andreessen Horowitz)等,公司最新估值已达10亿好意思元(约合72.6亿元东谈主民币)。

7月底这场亚裔好意思国科学家论坛闭门会上,李飞飞的演讲也让更多东谈主了解到Word Labs和她的“空间智能”发展理念到底是什么,即要让AI着实“从看到,到作念到”。

若何杀青从“看到”到“作念到”

所谓“空间智能”,是指东谈主们或机器在三维空间中的感知、集中和交互武艺。

这一见地最早由好意思国脸色学家霍华德·加德纳(Howard Gardner)在多元智能表面中建议,让在大脑中造成一个外部空间宇宙的模式,并巧合应用和操作。试验上,空间智能让东谈主有武艺以三度空间的面貌来想考,使东谈主知觉到外皮和内在的影像,也能重现、诊治或修饰影像,从而巧合在空间中安妥地游走,予求予取地操弄物件的位置,以产生或解读图形的讯息。

从广义上看,空间智能不仅包括对空间所在的感知武艺,还包括视觉分散武艺和形象想维武艺。而对于机器而言,空间智能则是指其在三维空间中的视觉数据处理武艺,巧合精确作念出展望,并基于这些展望接纳步履。这种武艺使得机器巧合像东谈主类同样在复杂的三维宇宙中导航、操作和方案,从而越过传统二维视觉的局限。

本年4月举行的TED演讲上,李飞飞坦言,视觉武艺激励了寒武纪大爆发,神经系统的进化带来了智能。“咱们想要的不单是是能看会说的 AI,咱们想要的是能作念的 AI。”

在李飞飞看来,空间智能是“处理 AI 工夫清苦的要害法宝”。

7月底这场闭门步履上,李飞飞最初归来了自10年前运行的当代 AI 三大驱能源:算法组成的“神经汇聚”,即“深度学习”;当代芯片,主若是英伟达GPU芯片;以及大数据。

自2009年以来,诡计机视觉畛域投入爆炸式进展。机器不错速即认出物体,和东谈主类的进展不相凹凸。但这只是冰山一角。诡计机数视觉不仅不错识别静止的物体,追踪迁移的物体,而且不错将物体分红不同部分,甚而不错集中物体之间的关系。因此,基于图片大数据,诡计机视觉畛域突飞大进。

李飞飞明晰地铭刻,约莫10年前,她的学生Andrej Karpathy参与缔造图释算法研究。他们给诡计机展示一张图片,接着通过神经汇聚,诡计机不错输出当然语言,比如说:“这是一只猫咪躺在床上。”

“我铭刻告诉Andrej,让咱们回转一下。比如给一个句子,让诡计机给出一张图片。咱们都笑了,合计可能长期不会杀青,或者将在很远的畴昔杀青,”李飞飞回忆说。

往日两年,生成式 AI 工夫迅猛发展。格外是几个月前,OpenAI发布了视频生成算法Sora。她展示了她的学生们在谷歌研发的雷同居品,质地相配好。这个居品在Sora发布以前几个月就存在了,而且所用的GPU(图形处理器)畛域比Sora少许多。问题是,接下来AI将走向何方?

“多年来,我一直示意,‘看到’即为‘集中宇宙’。然而我愉快将这个见地推动一步,‘看到’不单是是为了集中,而是为了作念到。当然界创造了像咱们这么有感知武艺的动物,但试验上从4.5亿年前,就存在这么的动物。因为这是进化的必要要求:看到和作念到是一个闭环,” 李飞飞示意。

她用她最可爱的猫咪当作例子。

一只猫咪、一杯牛奶、还有植物在桌子上的像片。当你看到这张照旋即,你脑海里其实出现一个三维视频。你看到了花式,你看到了几何。

事实上,你看到了几秒钟前还是发生的事情,和几秒种后可能发生的事情。你看到了这张像片的三维空间。你在规划接下来作念点什么。你大脑在运转,诡计若何作念才能辅助你的地毯,格外是这只猫咪是你我方的,地毯亦然你我方的。

“我把这一切称作空间智能,也即是将三维宇宙作念成模子,就物体、地点、事件等在三维空间和时辰内等进行推理。在这个例子里,我谈的是果真宇宙,但也不错指臆造的宇宙。然而空间智能的底线是将“看到”和“作念到”关连在沿路。有一天,AI将不错作念到这小数,“李飞飞示意。 

其次,李飞飞展示了基于多张像片重建的三维视频,然后她给出基于一张像片作念的三维视频,这些工夫都可用于联想中。

李飞飞示意,具身智能AI或者东谈主形机器东谈主,不错将把“看到”与“作念到”造成闭环。

她示意,斯坦福大学的共事们和芯片巨头英伟达正在调理进行名为BEHAVIOR的研究,将家庭步履构建一个基准的动态空间,从而评估多样机器东谈主在居家环境中的进展。“咱们正在研究若何将语言模子与大型视觉模子相招引,从而不错开采机器东谈主制定规划并运行步履,“她说。她给出三个例子,一个是机器东谈主在大开抽屉,另一个是机器东谈主在将手机充电线拔掉,第三个是机器东谈主在作念三明治。悉数辅导均通过东谈主类的当然语言给出。

临了,她给出一个例子,认为畴昔属于“空间智能”宇宙,东谈主类不错坐在那边,带上一顶有传感器的EEG帽子,无用张嘴讲话,仅靠意念汉典告诉机器东谈主:作念一顿日式大餐吧。机器东谈主收到意念后,解密意念,即可搞出全套大餐。

“当咱们将‘看到’与‘作念到’通过空间智能关连在沿路后,咱们即可作念到。”她示意。

李飞飞还示意,往日20年,她见证了AI豪放东谈主心的发展。然而,她认为AI或者AGI的要害一环即是空间智能。通过空间智能,看到宇宙、感知宇宙、集中宇宙并让机器东谈主作念事,从而造成良性闭环。

机器东谈主将接管东谈主类吗?

李飞飞在会议上示意,今天东谈主们对于AI畴昔不错作念什么太过夸张。她劝诫,东谈主们不要将贪念勃勃的、勇敢的主见与现实等量王人不雅,东谈主们听到太多这么的论调。

事实上,面前AI还是到达拐点,格外是大语言模子。“然而,它仍然是充满演叨的、有限的工夫,仍需要东谈主类深度参与其中,需要东谈主类集中它的有限性。当今相配危境的论调是所谓的东谈主类衰一火的风险,即AI正在成为东谈主类的机器主管。我认为,这对社会相配危境,此类言论将带来许多不测效用。AI的局限性莫得被东谈主类充分集中。咱们需要三想尔后行的、均衡的、莫得偏见的对于AI的疏通和莳植,“李飞飞强调说。

李飞飞认为,AI应该扎根于东谈主类。东谈主类创造了它,东谈主类正在发展它,东谈主类正在使用它,东谈主类也应该管束它。

李飞飞示意,在斯坦福大学“以东谈主为本的AI “研究所,他们接纳了三个对待AI的面貌,包括个东谈主、社区和社会三个层面:

在个东谈主层面,必须参与并拥抱AI。这是一个端淑的科技。AI调动孩子们若何学习,调动了医师若何使用会诊智商,调动了艺术家若何联想,调动了憨厚若何讲课。岂论是否为科技东谈主员,均不错判辨我方的作用,用负包袱地气派使用AI。在社区层面,AI可向社区赋能,可得志社区的环境保护需求,或者农业需求。有些农业社区使用机器学习工夫来检测社区水质。艺术家社区不仅在使用AI,而且抒发了他们的担忧,以及若何处理问题、削弱风险的想法。在社会层面,政府、研究机构、企业、联邦机构和外洋机构均应该负责对待这项科技。存在能源问题,这会影响到地缘政事。仍有开源与非开源的大询查,这影响到经济和生态。仍有管束的问题,比如AI的风险与安全等。必须接纳积极的面貌,一个多方参与的面貌,一个全社会的面貌。当今还是莫得回头路,李飞飞示意。她2017至2018年在谷歌率领AI技俩,在2020年至2022年担任推特的董事会成员,面前是好意思国白宫的AI顾问人。

对于AI对于责任的影响,李飞飞共享了她的看法。

李飞飞指出,在斯坦福大学以东谈主为本AI研究所内,有个数字经济实验室,由Erik Brynjolfsson训导率领。这个相配复杂的问题有许多层面。她格外强调,“责任”与“任务”是两个不同的见地,因为试验中每个东谈主的责任都由多项任务组成。

她以好意思国照拂作例子。据揣测,在照拂8个小时的班次中,任务数以百计。因此,当东谈主们询查AI接管或者取代东谈主类的责任时,必须分清是在取代任务如故在取代责任?

李飞飞认为,AI调动了一个责任内的多项任务,因此也会渐渐调动责任的性质。在呼唤中心场景中,生手的责任质地被AI提高了30%,然而老到东谈主员的责任质地并未因AI而有所升迁。斯坦福大学数字经济实验室的一篇著述呼应了李飞飞的不雅点,该著述的标题是:“AI不会取代司理的责任:使用AI的司理正在取代不使用AI的司理。” 

李飞飞强调,科技会带来分娩力的跳跃,然而分娩力的跳跃并不会自动回荡为社会的共同闹热。她指出,历史上曾屡次发生这么的事件。

(本文首发于钛媒体App,作家|Chelsea_Sun,裁剪|林志佳)

【EVSD-002】JUN女王様の特殊妄想クリニック2008-09-16大洋図書&$wailea87分钟



Powered by 果肉系列 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024 版权所有