似乎能与人交流,做出各种表情,表演的视频席卷络,但已经被研究神经络的专家ya打了假,没错,他实在看不过去,脏话都差点骂出了口。
回到这次的大会,rlffifr的担忧代表了业内很多专家的意见,这从他演讲的题目也可以看出来——“我们如何应对机器人、ai技术过热的时代”。
在另一个与人工智能紧密相关的领域,计算机视觉,专家们也觉得有必要告诉大家,你们眼中的“重大突破”、“吓了”的黑科技,还远没有到,诸如ai统治人类的“世界末日”的时候。
“你也可以说它很蠢”
在大会的计算机视觉专场,来自香港科技大学的权龙教授做了“计算机视觉,识别与三维重建”的演讲。
“人工智能的目的是让计算机去看、去听和去读。图像、语音和文字的理解,这三部分基本构成了我们现在的人工智能。而在人工智能的这些领域中,视觉又是核心,视觉占人类所有感官输入的八0,也是最困难的一部分感知,如果说人工智能是一场革命,那么它将发轫于计算机视觉,而非别的领域。”他说。
而当下的这场人工智能的热潮,也发轫于计算机视觉领域。如今,人工智能似乎要几乎等同于机器学习,等同于深度学习,等同于更专门一点的卷积神经络(简称)。与大众的普遍印象不同,在学者的眼中,引爆人工智能的不是alhag,而是01年的al,卷积神经络卷土重来。al更早的版本要追溯到199八年由ya建立的l。卷积神经络可以认为是改进了的神经络,一种据说是受人脑神经元的连接启发而设计的计算模型。
不过,和今天的受追捧不可,之前的神经络属于几乎无人问津的“冷门”。“那个时代,如果你在论文中提到,估计会直接被拒;但今天你的论文如果不提,就非常难入围(计算机视觉会议)。”权龙说。
利用,研究者不断改进模型设计,在一些识别任务,如图片识别上的错误率,在特定数据集上,已经超过了人类。这种成绩的取得,除了算法层面,权龙认为还要归功于算力的提升(如英伟达gu的更新迭代)以及大量的标准数据(如李飞飞创建的ia)。“如果你能清晰地定义问题,做好数据标定,这个问题基本就解决了。”权龙说。
不过,他提醒说,这种东西还有很大局限,并不是真的聪明,只是记住了很多样本。“你也可以说它很蠢,因为它根本不知道自己在做什么。一切取决于你的标准,如果你把一个东西标注成猫,它就认为这是一只猫,明天你再把它标注成狗,它就认为这是一条狗。”他说。
的优势,在权龙看来,在于端到端,把数据丢给模型就可以了,而且无需像之前需要人工定义,就能学到维数动辄上百万的有结构的视觉特征。他认为,下一步计算机视觉要在识别的基础上,走向三维重建。“我们是活在三维空间里,要做到交互和感知,就必须将世界恢复到三维。”他说。
“人眼基本不会犯这样的低级错误”
确实,除了物体识别(rgi)外,计算机视觉研究还包括了三维重建(rsru),图像重组织(rrgaia)。在这次大会上,同为计算机视觉专家、加州大学伯克利分校的马毅则对深度学习进行了更深刻的反思。
“视觉并不仅仅是找任意一个算法或系统,能对一个数据库中对图像分类、恢复三维几何,或者分割就可以了。而这样的算法和系统的重要性能必须要有保障。首先是对噪声不敏感(issiiv),数字图片识别对的噪声和扰动稳定(sabl);此外要保证对干扰要稳健或鲁棒(rb),例如戴眼镜,化浓妆也能人脸识别;还有对姿态不变性(ivaria),物体姿态变化、图片变形也不会影响结果。”他说。
如果从这三个要求衡量,他说,现在的物体(人脸)检测以及识别技术并不能在这几方面提供严格的保障,经验验证尚且不充分,更谈不上理论上的严格保障。他在现场展示了最近的两项研究,给听众留下了深刻印象。
其中一项研究[1]涉及人脸的检测,在图片上加了一个很的噪声后,用当前最好的卷积神经络看,就已经检测不出是人脸了,更不用说识别出是谁。
————
官方暗号群:550591,嘿嘿快来一起为《别进游戏》搞戏啊!!现在群里已经几百人,谢谢大家的评论支持,我一定继续努力!不出意外每晚6点到9点间准时更新,感谢大家!!
第四十谈 好生修养中[2/2页]