《AI未来进行式》Epub-Pdf-Mobi-Txt-Azw3 下载在线阅读

 AI未来进行式Epub-Pdf-Mobi-Txt-Azw3 下载在线阅读

豆瓣评分:8.1

内容简介

   人工智能专家李开复与科幻作家陈楸帆创造性合作,畅想了20年后在人工智能等科技影响下的人类世界。

   书中10个引人入胜的短篇故事,展示了一系列令人大开眼界的未来场景——身临其境的沉浸式娱乐方式、自如使用人类语言的虚拟伴侣、没有“司机”的完全自动驾驶汽车、能够以假乱真的照片和视频,以及基于量子计算、计算机视觉和其他AI技术的展开应用。

   在这些故事给读者带来惊奇体验的同时,每一个故事之后的科技评论则让我们进行突破性的深度思考——人工智能能否帮助人类从根源上预防疫情?人们该如何应对未来的职场挑战?在人工智能主导的世界中,该如何确保文化多样性?人们如何教导下一代适应人类与人工智能共存的新社会?如何面对人工智能带来的社会问题,及其所隐含的人性拉锯战?……

   通过阅读这些有关未来的技术蓝图与分析,相信你我将能更真切地看到人类未来将要前进的方向。

   欢迎进入AI未来进行式!

作者简介

   李开复,卡内基梅隆大学计算机科学博士。全球著名人工智能专家、投资人、畅销书作家。曾担任谷歌全球副总裁兼大中华区总裁,并曾在微软、苹果等公司担任要职。2009年创立创新工场,致力帮助创业者成长与发展。出任世界经济论坛人工智能委员会联席主席,并被《时代》周刊评选为影响全球100位年度人物之一。出版中文畅销书10余本。

   陈楸帆,科幻作家、编剧、翻译、策展人。中国科普作家协会副理事长,世界华人科幻协会名誉会长。曾获得星云奖、银河奖、科幻奇幻翻译奖、茅盾新人奖等奖项,在许多欧美科幻杂志均为首位发表作品的中国作家。其作品曾被翻译为20多国语言,代表作有《荒潮》《人生算法》等。

epubooks.top站是一个下载优质电子书的网站,书籍种类非常多,每个类目下的书籍资源都非常丰富,支持kindle、epub、mobi、azw3、pdf格式下载。以及在线阅读-epub,kindle,mobi,azw3,pdf格式! 一個下載優質電子書的網站,書籍種類非常多,每個類目下的書籍資源都非常豐富,支持kindle、epub、mobi、azw3、pdf格式下載。以及在線閱讀-epub,kindle,mobi,azw3,pdf格式! ======================================================= 记得收藏本站哟!每天都会更新 资源收集不易,还请帮忙点一点,是我的动力谢谢!!!!!!!!!! 如果有什么书本站没有,你也可以在评论处留言。我会第一时间去的! 收藏本站每日更新更多书籍! 资源地址: Epub版-----网盘密码1122 MOBI版-----网盘密码1122 PDF版------网盘密码1122 TxT版------网盘密码1122 azw3版------网盘密码1122 ======================================================= 部分简介:
今天,他是来告别的。 舞台上方供奉着黑皮肤的神祇:克瓦米·恩克鲁玛、马丁·路德·金、马尔科姆·X、托马斯·桑卡拉、纳尔逊·曼德拉、钦努阿·阿契贝、沃莱·索因卡、埃丝特·伊班加……这些伟大的灵魂都曾用自己的全部生命来捍卫人民的自由、民主与平等。在表演中,表演者经常会停下来,以传统的沉默方式祭拜先人,这已经成为一种标志性的仪式。 阿玛卡默默地把那些面孔牢记在脑海里,祈祷这些神祇守护自己。 他要离开拉各斯,回到自己的家乡,向父亲坦白一切。至于未来做什么,他还没有想好。也许使用GANs的好手艺能帮他找到一份正经工作,不用再去伪造什么,而是真正地帮助一些人:给医疗AI的训练数据集换脸以保护隐私,同时保留患者的面部病征;或者给老旧的黑白影片上色、提高分辨率,甚至修改演员嘴形以配合不同的语言;或者通过图像快速评估水果和农产品质量;或者一些他不太敢去想的事情,比如拍一部真正的尼莱坞电影。 Smartstream发出一声清脆的金币声,阿玛卡低头查看。齐承诺的报酬到账了。这也意味着那段足以乱真的视频正在网络上以核爆的速度传播开了,冲击着数百万FAKA追随者的信念。 历史上,由AI伪造的视频曾引发加蓬共和国兵变和马来西亚政坛风暴。阿玛卡不敢想象他伪造的视频将给尼日利亚带来什么后果,但他已经做出了自己的选择。 阿玛卡站在舞台正前方,面向高高在上的费拉·库蒂的黑白肖像,双手举过头顶,伸向前方,像是在连接神祇的力量。 “我将成为自己命运的主人,并决定死神何时带走我。” 这句带有魔力的咒语从男孩口中说出,它是费拉·库蒂对自己起的中间名“Anikulapo”的解释,“Anikulapo”在约鲁巴语中意为“我把死神装在口袋里”。 阿玛卡在smartstream上输入指令,然后随手将它丢进垃圾桶。他重新戴上那副粗糙的3D打印面具,希望在齐发觉这一切之前,逃得越远越好。他将远离这座到处写满“Eko o ni baje”(4)的巨大城市,回到充满泥土芳香的家。 他选择通过制造谎言来消除谎言。 第二段用DeepMask伪造的视频已经上传到了网络上,即将引爆。与第一段视频的不同之处在于,当FAKA摘下数字面具,露出雷波那张能够通过所有防伪检测的完美面孔之后,他将继续摘下自己的面具,一层又一层的面具,无穷无尽的面具。 尼日利亚人将会惊奇地发现,它们正是新非洲神社里供奉的那些神祇的脸。 (1) 在伊博族的传说里,恩扎(Nza)是一种小而凶猛的鸟,食量很大,象征着获得财富。 (2) 伊博语,意为“谢谢”。 (3) 意为“费拉·阿尼库拉波·库蒂的化身”。 (4) 约鲁巴语,意为“禁止破坏”。 开复解读 《假面神祇》讲述了一个利用技术手段欺骗人类视觉的故事。 如果AI不仅可以看见、识别物体,还能对其加以理解及合成,那么就可以巧妙利用这些能力,创造出让人们无法分辨真伪的图像和视频。在《假面神祇》所描绘的未来中,人们再也无法单纯依靠肉眼来辨别一段视频究竟是实地拍摄的,还是利用技术手段伪造的,为此,政府不得不出台相关法律,要求网站和App安装防伪检测器(类似于如今的杀毒软件),以保护用户权益免受伪造视频的侵害。在这样的大环境下,深度伪造(Deepfake)攻守双方的拉锯战就将演变成一场军备竞赛——拥有更多算力的一方会获得最终的胜利。 上述情况在2042年之前就会在发达国家出现,因为发达国家在大约10年内就能部署昂贵的计算机来防御Deepfake,也有足够好的复杂工具和AI专家来进行防御,进而率先实施相关的反Deepfake法案。而较落后的国家,如尼日利亚,可能到2042年左右才会碰到Deepfake的攻守拉锯战。 那么,AI是如何(通过摄像头和预先录制好的视频)掌握“看”这项能力的?一旦能看,将出现什么样的应用?基于AI的Deepfake究竟是如何实现的?人类或AI能够看穿Deepfake的真面目吗?社交网络是否将被假视频占领?人与人之间的信任会因此而被粉碎吗?怎样才能阻止Deepfake的滥用?AI技术还存在哪些安全漏洞?Deepfake背后的技术难道就不能给人类带来好处吗? 我们将在下面就这些问题展开讨论。 什么是计算机视觉技术 通过《一叶知命》这个故事,我们看到了深度学习技术在互联网及金融等大数据应用领域的巨大潜力,已经不会对AI在大数据的应用领域超越人类感到惊讶了。那么在人类所特有的能力方面,例如感知,AI的表现又会如何呢? 在人的六感之中,视觉是最重要的。计算机视觉(Computer Vision,CV)是AI的技术分支之一,主要研究如何让计算机拥有“看”的能力。这里的“看”不仅意味着看到并捕捉一段视频或图片,而且意味着能够分析并理解图像序列的内容和含义。 由简单到复杂,计算机视觉技术包括以下从简单到复杂的功能。 ※ 图像采集和处理——使用摄像头及其他类型的传感器采集真实世界中的三维场景,将其转化为视频。每段视频就是一系列的图像,而每个图像都是一个二维矩阵,矩阵里的每个点都代表人所能看到的颜色(这个点也就是所谓的“像素”)。 ※ 目标检测和图像分割——把图像划分为若干个不同区域和物体。 ※ 目标识别——对物体进行识别(例如识别出一只狗),并在此基础上掌握更多的细节特征(例如确认该狗为德国牧羊犬、深棕色等)。 ※ 目标追踪——在视频中定位和跟踪物体。 ※ 动作识别——对动作和手势进行识别,如Xbox体感游戏中的舞蹈动作。 ※ 场景理解——对一个完整的场景(例如一只饥饿的狗正在盯着一根骨头)进行分析并理解,掌握其中复杂而微妙的关系。 故事中的阿玛卡为了让FAKA摘下面具露出雷波的脸,使用了Deepfake制造工具去伪造视频,他的操作过程涉及了上述所有步骤。 具体来看,阿玛卡首先要把一段真实的FAKA视频分解成每秒60帧的图像,每张图像都用数千万个像素来表示;接下来,AI会读取图像上的像素,然后自动识别并分割出FAKA的身体(可以想象成用笔描出FAKA的身体),进而分割出FAKA戴着面具的脸庞、嘴唇、手/手指等具体部位。AI要对视频分解出来的每一帧图像重复这样的操作,如果是一段50秒长的视频,那么就需要对50×60=3000帧图像进行处理。除此之外,AI还要关联并追踪帧与帧之间的运动姿态,发掘物体之间的关系。所有这些工作都只是阿玛卡编辑伪造视频之前的预处理。 也许你看到这里会想,原来计算机视觉这么费劲呀!做了这么多工作,还没开始造Deepfake呢!上面提到的这些工作,对于人类来说可都是不费吹灰之力的——人类只要看上一眼视频,就能瞬间在脑海中抓取并消化上面提到的内容和信息。而且,人类能够对事物进行广义的理解和抽象的认知,即使同一物体在不同的角度、光线、距离下存在视觉上的差异,甚至有时会被其他物体遮挡住,人类也能通过推理产生相应的视觉认知。例如我们只要看到雷波以一种特定的姿势坐在办公桌前,就算没有看到他究竟在干些什么,也可以推断出他正在拿着一支笔在纸上写字。 我们在“看”的时候,调用了许多过去积累的有关这个世界的知识,包括透视现象、几何学、常识,以及之前看过、学过的所有东西。对于人类而言,“看”似乎是一件自然而然的事情,但我们却很难把这项能力传授给计算机。计算机视觉就是一个旨在克服这些困难,让计算机学会“看”懂物体的研究领域。 计算机视觉技术的应用 事实上,目前的计算机视觉技术已经具备了实时处理能力,应用场景覆盖了许多领域,我们每天的生活里都有这种技术的身影,例如: ※ 化身汽车上的“助理驾驶员”,监测人类驾驶员是否疲劳驾驶; ※ 进驻无人超市(如天猫无人超市),通过摄像头自动识别顾客把商品放进购物车的过程; ※ 为机场提供安全保障,用于清点人数,识别是否有恐怖分子出没; ※ 姿态识别,开发Xbox舞蹈游戏,为用户的动作打分; ※ 人脸识别,让用户“刷脸”解锁手机; ※ 智能相机,iPhone的人像模式可以识别并提取前景中的人物,巧妙地让背景虚化,效果堪比单反相机; ※ 应用于军事领域,将敌方士兵与平民区分开,或打造无人机和自动驾驶汽车。 在《假面神祇》的开头,我们看到:人们在穿过检票闸机时,摄像头会通过人脸识别系统自动扣取乘车费用;行人的动作可以激活广告牌上的卡通动物,而且通过手势,行人还能与这些卡通动物进行互动;阿玛卡的smartstream利用计算机视觉及AR功能,实时在街景上叠加了一条虚拟的路线,为他指明目的地的方向…… 计算机视觉技术还可以基于现有的图像或视频进行“锦上添花”,例如: ※ 对照片和视频进行智能编辑,比如美图秀秀等软件工具,在计算机视觉技术的支持下,可以实现优化抠图、去红眼、美化自拍等功能; ※ 医学图像分析,比如检查判断肺部CT中是否有恶性肿瘤; ※ 内容过滤,监测社交媒体上是否出现色情、暴力等内容; ※ 根据一段视频内容搭配相关广告; ※ 实现智能图像搜索,根据关键字或图像线索查找目标图像; ※ 实现换脸术,把原视频中A的脸替换为B的脸。 《假面神祇》中的Deepfake视频是用一个自动编辑视频的AI工具做的,能够把原视频中的人完全替换成另一个人,无论是面部、手/手指、说话的声音,还是步态、体态、面部表情等都惟妙惟肖。我们将在后面详细介绍有关Deepfake的内容。 计算机视觉的基础——卷积神经网络(CNN) 基于标准神经网络的深度学习并非易事。一张图像就有数千万个像素,让深度学习模型从海量的图像中挖掘出其中的微妙线索并成功提取特征,是一个不小的挑战。 研究人员从人类大脑中获得灵感,拓宽了深度学习的边界。每当眼睛看外界事物时,大脑中的视觉皮层会调用许多神经元,这些神经元只接受来自其所支配的刺激区域(也称“感受野”)内的信号。感受野能够识别线条、颜色、角度等简单特征,然后将信号传递给大脑最外层的新皮质。大脑皮层会按照层次结构存储信息,并对感受野输出的信号加以处理,然后进行更为复杂的场景理解。 卷积神经网络(CNN)就是受人类视觉工作机制的启发而产生的。每个卷积神经网络中都有大量类似于人脑感受野的滤波器。这些滤波器,会在图像处理的过程中被反复使用。每个滤波器都只针对图像的部分区域进行特征提取。深度学习的原理,就是通过不断向模型“投喂”大量的图像实现模型的优化,在这个过程中,卷积神经网络的所有滤波器都将自主学会应该提取哪一个特征。每个滤波器的输出,都是它所检测的特征(例如黑色线条)的置信度。 与大脑皮层的功能网络架构类似,卷积神经网络的架构也有等级之分。每一层滤波器输出的特征置信度都将成为下一层滤波器的输入,用于提取更复杂的特征。举个例子,如果把一张斑马的图片输入卷积神经网络,那么最初一层的滤波器可能会针对图片的每个区域检测黑色线条和白色线条;高一层的滤波器可能会在更大的区域里检测条纹、耳朵、腿;再高一层的滤波器可能会检测出更多的条纹、两只耳朵、四条腿;有些卷积神经网络的最高层滤波器也许会去分辨图片中的动物到底是斑马,还是马或者老虎。 需要说明的是,我们刚才只是为了便于读者理解,才使用人类容易理解的这些特征来举例说明卷积神经网络可能提取的特征(如条纹、耳朵),但在实际训练中,卷积神经网络将以最大化目标函数为前提,自主决策每一层滤波器会提取哪些特征,也许是条纹、耳朵,但更可能是一些超出人类理解范畴的特征。 卷积神经网络是为计算机视觉而生的一种改良版深度学习模型架构,而且有不同版本的变体,适用于处理不同类型的图像和视频。 人们在20世纪80年代首次提出了“卷积神经网络”这个概念,但可惜的是,当时并没有足够的数据和算力让卷积神经网络发挥应有的作用。直到2012年前后,人们才清楚地意识到这项技术有潜力击败所有传统的计算机视觉技术。 现在回头去看,计算机视觉技术其实占尽了“天时地利”。因为正是在2012年前后,人们用开始流行起来的智能手机拍摄了海量的图像及视频,然后把它们分享到社交网络上,深度神经网络的训练才有了充足的数据。同时,高速计算机和大容量存储设备的价格大幅下降,为计算机视觉技术提供了算力支持。这些要素汇合到一起,共同促进了计算机视觉技术的发展和成熟。 Deepfake “特朗普是个彻头彻尾的白痴。”在一段视频里,奥巴马这样说道。 这段视频里的奥巴马,无论是声音、相貌还是表情,都跟真正的奥巴马非常相似。 2018年末,美国演员乔丹·皮尔(Jordan Peele)与新闻聚合网站BuzzFeed合作,“自编自导”制作的这样一段“假”的Deepfake视频,迅速在网络上传播开。AI以皮尔的一段讲话录音为基础,把皮尔的声音转变成了奥巴马的声音,然后对奥巴马的一段真实视频进行调整,让他的面部表情甚至嘴形都能够与讲话的内容相匹配。整段视频看起来没有丝毫的违和感。 制作这段视频的初衷是向人们发出警告:Deepfake内容很快就会走进我们的日常生活。果不其然,同年,网络上就出现了一些以著名女明星为主角的“虚假色情片”:有人用制造Deepfake的工具把色情片女主角的脸替换成了当红女明星的脸,直接引发了众怒,美国政府甚至不得不出台新的法律明令禁止这种行为,不过类似的情况还是屡禁不止。 2019年,一款全新的App在中国横空出世。这款App能够帮助用户实现他们的“电影梦”:在短短的几分钟内,用户只要使用这款App进行自拍,就能收获一段专属视频——在指定的电影片段之中,用户的脸会替换男女主角的脸,并随着剧情的变化做出相应的表情和反应。我也试着过了一把明星瘾(替换周润发),只不过新生成的视频仍然保留了电影的原声。不过,这也降低了App的开发难度。 2021年,一款名为Avatarify的App连续问鼎苹果App Store免费下载榜单Top 1。这款App的功能是让用户上传的照片“动起来”——用户可以操纵照片中人物的表情,例如,香港歌坛“四大天王”与“还珠格格”共唱洗脑歌曲《蚂蚁呀嘿》。我也只花了几秒钟,就让自己过去出版的书的封面肖像唱了一段英文老歌Only You,效果非常“魔性”。 Deepfake似乎在一夜之间就火爆了起来。任何人都可以用它制作一段“假”视频,虽然视频的质量可能比较业余,会让人看出端倪,可是这并不妨碍Deepfake的流行与普及。 但换个角度来考虑,这也意味着,在我们的世界里,未来的所有数字信息都有被伪造的可能。无论是线上的视频、录音,还是安保摄像头拍摄的画面,甚至法庭上的视频证据,都有可能是假的。 在《假面神祇》这个故事中,阿玛卡使用的Deepfake制造工具,比皮尔在2018年使用的要先进得多,所制作出来的视频不仅更加成熟、质量更高,而且天衣无缝到连人类的肉眼或者普通的防伪检测器都看不出任何问题。 阿玛卡利用软件工具,把自己希望“雷波”说的文本,通过语音合成系统转化成与雷波本人的声音高度相似的语音。接下来,再经过AI算法合成雷波的面部表情和口型,让“雷波”在说这段话时自然流畅。下一步,把合成的“雷波”的脸与FAKA的身体叠加在之前处理过的视频中,确保手、脚、颈部等重点部位能够以假乱真,在呼吸节奏、关节连接处等细节上也力求无懈可击。 除这种基于视频的Deepfake换脸方式外,还有一种换脸方法——三维建模,这种方法与3D动画片《玩具总动员》的制作过程类似。三维建模属于计算机科学分支之一——计算机图形学的研究范畴,这是一门使用数学算法对一切事物进行建模的学科,哪怕是像头发、微风、阳光、阴影一样细微的事物,也要有相应的数学模型。三维建模方法的优点在于,人们的创作自由度较高,可以随心所欲地创建各种物体,并操纵这个物体去做各种事情。但相应地,这种方法的缺点是计算复杂程度更高,对算力的要求也更大。 2022年的电脑速度做出的三维建模的水平还不能达标,完全无法骗过人类的眼睛(这也是为什么动画电影中的人物看起来不那么真实),更别说通过防伪检测器的验证了。不过,到了2042年,人类也许会成功构建出具有高度真实感的三维模型,我们将在本书后面的故事《双雀》和《偶像之死》中看到三维建模的应用。 大部分人可能会出于好玩、恶搞的心理去伪造一些视频,但肯定也有人会出于恶意去制造和传播Deepfake视频,就像《假面神祇》中逼迫阿玛卡给FAKA换脸的齐。除了伪造传播性极广的谣言或假新闻,Deepfake还可能被有心之人用于伪造证据、敲诈勒索、骚扰、诽谤,更严重的还会操纵选举。 Deepfake到底是怎么实现的?AI技术如何检测一段视频的真伪?当Deepfake与反Deepfake双方产生对立时,哪一方会在这场竞争中取得胜利?要回答这些问题,我们需要先了解Deepfake背后的工作机制和原理。

发表评论

0 评论