7月6日,在2023世界人工智能大会分论坛引领未来 赋能焕新2023浦东论坛上,清华大学新闻学院元宇宙文化实验室主任沈阳带来了主题为《AIGC和ChatGPT发展与挑战》的演讲。
沈阳表示,今天的演讲材料有一部分内容是人工智能写的,去年写元宇宙的报告花了6个月时间,今年写AIGC的报告花了两个月的时间,7月底马上会发一个人形机器人的报告,大概只需要20天左右的时间,所以团队最近在做内容的生产和理论的研究方面,效率实际上已经提升了9倍。
沈阳表示,今天的演讲涉及到两个关键主题:AIGC和元宇宙。沈阳介绍:我们主要研究就是AI、元宇宙包括机器人,我们最近几年一直在发各种报告,当然也写论文也写专利报告方面,我们2015年到2020年主要是新媒体报告,2020年开始做虚拟数字人的报告,我们已经发过三个报告了,2021年我们发了元宇宙的报告,这个是世界上第一份元宇宙的学术报告。
沈阳在会上将元宇宙的特性总结为三个三。第一个三是三维的空间互联网,即空间技术发展完善的互联网。第二个三是三元化的体验互联网。沈阳认为,一个好的元宇宙需要虚拟人作为支撑,只有在三维虚拟空间和三维的虚拟人交流,元宇宙具备基本形态。目前有很多产品是在二维的手机和电脑上,这不是我们真正需要的元宇宙。沈阳说道,我们需要的是在一个三维的环境中,用XR、全息投影、裸眼3D、脑机接口等技术实现真正的虚拟空间,而这些技术有强大的算力需求,就需要用到大规模的人工智能。总结中的第三个三则是指Web3.0,元宇宙三全化的价值互联网。
Vision Pro的发布后,我发现从技术指标来看非常惊人。沈阳将Vision Pro的特点分为三点,首先在算力方面,Vision Pro算力比现有所有的XR装备算力至少提升了3倍以上。其次是分辨率,现在主流的VR分辨率是4K,但Vision Pro则达到8K。我估计当VR设备达到32K左右的分辨率时,我们就有可能分辨不出真实世界和虚拟世界的空间。沈阳将这一分水岭称之为虚拟空间的图灵测试。
它的交互方式完全变了,原来我们用手机是手和屏幕的接触,为什么叫手机?是你的手在操作机器,但是没有进plus,用眼神和手势,眼神和手势才是人非常自然的一种交互的模式,并且它的频度会高很多,想一下一个眼神过去,每天的交互的频度会可以高很多,如果这一套机制移植到AR上面来,将是一个重大的进展,所以Vision Pro从技术上来说确实挺好的进展。
沈阳同时表示,但是由于价格昂贵,从产品和商品上来说,Vision Pro不一定是很好的进展。另外,Vision Pro内容现在还缺乏。随着这些技术指标的不断提升,Vision Pro这个系列将会有更好的表现。沈阳提及,第二个重大进展是今年谈到的AR和chatgpt的结合。沈阳表示,第三个重大进展就是深层次智能在元宇宙中的使用。
沈阳告诉记者,AIGC技术和空间计算技术将是构建元宇宙的重要组成部分,将会在未来促使空间计算大模型、元宇宙大模型的诞生,在大模型极大的促进生产力的情况下,终极的元宇宙形态才有可能实现。
最后,沈阳向记者表示:虽然现在很多人唱衰元宇宙,但我认为,终极元宇宙是人类的未来,万物皆在一念之间。我们需要成百上千年来实现,乃至需要AGI支撑生成技术、需要脑机接口实现提供交互支持,需要民用核聚变提供能耗,但我认为我们应该为此努力,而不是关注眼前的苟且。