热点:

    美媒评2018年全球十大突破性技术 第二个亮了!

      [  中关村在线 转载  ]   作者:中关村在线   |  责编:吕东兴

      5. 对抗的神经网络


      人工智能非常擅长识别物体。在100万张照片中,它可以准确指出哪张照片中有行人正在过马路。然而,人工智能并不适合绘制一张图片,显示有行人正在过马路。如果能做到这一点,那么人工智能就能创造出非常逼真的模拟环境,让无人驾驶汽车在这样的模拟环境中训练。

      问题在于,创造新东西需要想象力,而想象力是人工智能所不擅长的

      2014年,蒙特利尔大学博士生伊安·古德费罗(Ian Goodfellow)在一家酒吧的学术辩论中首先想到了这个解决方案,这被称作“生成对抗网络”(GAN)。GAN让两个神经网络在数字版的“猫鼠游戏”中相互对抗。

      两个网络都使用相同的数据集去训练。其中一个名为“生成器”,任务是利用所看到的图像去创建不同版本,例如3只手的人。而另一个名为“鉴别器”,任务是识别所看到的图像是否是生成器制造的假图像。

      通过这样的过程,生成器将非常善于产生图像,导致鉴别器无法判断哪些是真实图像,哪些是假的。从本质上来看,生成器被训练去识别并制作看起来真实的图像。

      过去10年,GAN成为了人工智能最有前景的领域之一,帮助机器生成能迷惑人眼的结果。

      GAN已被投入使用,用于制作听起来很逼真的语音和图像。例如,英伟达的研究者向GAN提供了大量明星照片,随后创造出数百张并不存在的头像。另一个研究团队则生成了类似梵高作品的假画。更进一步,GAN可以以不同方式来重新想象画面,例如将阳光灿烂的道路变成一条雪路,或是将马变成斑马。

      结果并不总是完美的:GAN或许会给自行车安上两个车把,或是把眉毛放在头像错误的地方。不过,由于生成的图像和声音往往非常真实,因此专家认为,从某种意义上来说,GAN已经开始了解所看到和听到的世界的底层结构。这意味着除了想象力之外,人工智能还能获得更独立的能力,理解所见的世界。

      6. 巴别鱼耳塞

      在风靡一时的科幻经典《银河系漫游指南》(The Hitchhiker’s Guide to the Galaxy)中,你可以将黄色的巴别鱼滑进耳朵,听到同声翻译。在现实世界中,谷歌已经想出了临时解决方案:一对售价159美元的耳机,名为Pixel Buds(中文译为“像素花蕾”),可与Pixel智能手机和谷歌翻译App应用配合使用,获得实时翻译。

      一个人戴着耳机,另一个人拿着手机。耳塞佩戴者用他或她的语言说话——默认语言为英语——App应用把语句翻译过来,传到电话中,大声播放出来。拿手机的人回应;回答被翻译过来,传到耳机里播放。

      谷歌翻译已经拥有会话功能,它的iOS和Android应用程序允许两个用户交谈,对话将被自动识别并翻译过来。但是,背景噪音会使App应用难以理解人们的对话,也不知道人们何时停止交谈,何时开始翻译。

      Pixel Buds绕开了这些问题,办法是让用户在讲话时按住右耳塞。将手机和耳机的互动区分开来,可以人为控制麦克风,有利于通话者保持目光接触,不用将手机拿来拿去。

      Pixel Buds的设计欠佳,广受批评。它们看起来很傻,可能不适合你的耳朵,也很难与手机互连使用。

      但是,笨重的硬件不难搞定。Pixel Buds展示了在语言之间实现实时理解沟通的大好前景,而且,不再需要鱼儿了。 

    jd.zol.com.cn true //jd.zol.com.cn/678/6788597.html report 2584   5. 对抗的神经网络  人工智能非常擅长识别物体。在100万张照片中,它可以准确指出哪张照片中有行人正在过马路。然而,人工智能并不适合绘制一张图片,显示有行人正在过马路。如果能做到这一点,那么人工智能就能创造出非常逼真的模拟环境,让无人驾驶汽车在这...
    提示:支持键盘“← →”键翻页阅读全文
    本文导航
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    • 热门集成灶
    • 新品上市
    推荐问答
    提问
    • 论坛精选
    • 最热回答
    0

    下载ZOL APP
    秒看最新热品

    内容纠错