

剪辑|杨文
最近,YouTube 向用户发起窥察:你刚刚看的这个视频,有莫得「AI 烂片」的嗅觉?
评分从「十足莫得」到「极其显明」,由用户自行判断。
官方的证实注解是,平台但愿借此打击泛滥的低质地 AI 生成内容。

音讯一出,有东说念主鼓掌称快,合计 YouTube 终于动手整治乱象。

有东说念主则合计名义是举报 AI 烂片,实质上在帮谷歌进修下一代 AI。

YouTube 每天有 1.22 亿活跃用户。当这些东说念主运转对 AI 视频逐个打分,他们实质上是在告诉系统,哪些画面、哪些动作、哪些细节,会让东说念主一眼看透这是 AI 生成的。
这批数据,刚巧不错平直用于进修谷歌旗下的 AI 视频生成模子 Veo,让下一代模子知说念那儿「露馅」了,从而生成更难被肉眼分辨的视频。

与此同期,谷歌还向一家特意为儿童制作 AI 视频内容的初创公司投资了 100 万好意思元。

事实上,这家公司已作念了相通的事情整整十五年。
每当咱们绽放浏览器、登录银行账户或是在网购平台下单,屏幕上总会跳出一个老练的小方框,条件点击几张图片,或是在一个勾选框附近打上对勾。
咱们以为这仅仅通盘退缩机器东说念主入侵的安全关卡,实则在那短短十秒钟里,咱们正在为一家市值数百亿好意思元的科技巨头,无偿完成一项极具生意价值的责任。
这套系统叫作念 reCAPTCHA,它是互联网史上规模最大、也最鲜为东说念主知的数据收罗行为。
那说念「考证码」,从来齐不仅仅考证码
故事要从 2000 年前后提及。
彼时,垃圾邮件机器东说念主正在席卷互联网,论坛被多数刷帖,用户收件箱被塞满无谓信息,万般网站急需一种要领来分散确凿的东说念主类用户与自动化圭臬。
卡内基梅隆大学训诲路易斯・冯・安发明了 CAPTCHA,这是一种将笔墨歪曲变形、只须东说念主类才智辨别的图形考证码。
冯・安意志到,每天非常以百万计的东说念主在这些考证码上消费理会元气心灵,开云app要是这些元气心灵能被同期指点去作念另一件有价值的事,会怎样?
2007 年,他推出了 reCAPTCHA。
考证码不再袒露立时乱码,转而呈现来自确凿册本的扫描图像,那些计较机尚无法自动识别的古旧笔墨。用户每完成一次考证,就即是匡助完成了一小段古籍的数字化。这些书来自《纽约时报》历史档案与谷歌典籍技俩,总量提升 1.3 亿册。
2009 年,谷歌收购了 reCAPTCHA。确凿直规模的数据收罗,就此运转。

到 2012 年前后,辨别歪曲笔墨的期间走到了极端,谷歌有了新的需求。
谷歌的街景收罗车正在将地球上的每一条说念路拍进镜头,相干词原始像片仅仅数据。要让 AI 确凿读懂这些图像,就必应知说念画面里那儿是红绿灯、那儿是东说念主行横说念、那儿是店面牌号。
这一进程在机器学习领域叫作念「数据标注」,是进修计较机视觉模子弗成枯竭的门径,亦然一项造价漂后的工程,行业市价时时在每小时 10 至 50 好意思元之间。
谷歌就把标注任务嵌进公共每个东说念主每天齐绕不开的东西里。reCAPTCHA v2 转换了界面,米兰体育app官网用户濒临的是一组来自谷歌街景的确凿像片,被条件「点击统统包含红绿灯的方块」,或「选出每一处东说念主行横说念」。
看起来还是通盘安全考证,背后的每一次点击,齐是在为谷歌的计较机视觉模子打上精准的进修标签。

浩瀚的规模
繁华期间,公共每天有 2 亿个 reCAPTCHA 被完成,每次耗时约 10 秒,折合每天提升 50 万小时的东说念主工服务。按数据标注行业最低市价估算,谷歌每天从中取得的免费服务价值高达 500 万好意思元。
reCAPTCHA 险些无处不在,每一家银行、每一个政务平台、每一个电商网站,齐将它镶嵌了登录进口。用户根蒂莫得绕行的余步,思拜谒我方的账户,就必须先完成标注。
这种强制性,是其他任何数据收罗神志齐无法企及的。Scale AI、Appen 等专科标注公司雇用了数十万名工东说念主,有经常薪不及一好意思元,但即便如斯,也无法达到 reCAPTCHA 所遮蔽的规模与密度。

这些数据最终流向了两款家具。
一是谷歌舆图。行为公共使用最广的导航器具,它识别路牌、定位商家、齐集城市地舆的底层才略,有荒谬一部分缔造在这些东说念主工标注之上。而那些完成标注的东说念主,大多仅仅思查一下账单余额,或是在网险峻一张订单。
二是 Waymo。这是谷歌旗下的自动驾驶技俩,2016 年寂寞运营。自动驾驶汽车要在确凿说念路上安全行驶,必须以近乎竣工的精度识别红绿灯、行东说念主、泊车符号等数千种视觉信息,这些识别任务所需的中枢进修数据,恰是由数以百万计、对此绝不知情的庸碌用户通过 reCAPTCHA 完成标注的。如今 Waymo 估值 450 亿好意思元,2024 年完成提升 400 万次付费载客,仍在抓续膨胀。
2018 年,reCAPTCHA 推出第三个版块,这一次连考证题齐消散了。系统在后台静默运行,跟踪用户的鼠标轨迹、页面滚动速率和光标停留位置,通过分析这些步履花式来判断拜谒者是否为确凿东说念主类。这些步履数据,相通源源赓续地流入谷歌的 AI 进修体系。
结语
冯・安往常的构思,在某种进程上称得上是对东说念主类理会资源的一次创造性调养,把东说念主们本来就要花在垃圾过滤上的元气心灵,指点去作念一件确凿有真谛的事。这个起点,本人并无坏心。
但有东说念主合计,谷歌将一套用户别无聘用、必须使用的安全机制铺设至整个互联网,尔后将产出的海量数据悄然收割,滚动为价值数百亿好意思元的生意家具。整个进程中,用户不仅一无所获,以致连知情的权益齐未尝领有。
今天 YouTube 对 AI 视频打分这件事,似乎亦然把用户自愿的步履,包装成一项故意于平台生态的举动,同期将产生的数据暗暗收入囊中米兰体育app官网,用于喂养下一代生意家具。
快乐飞艇pk10官网入口上一篇:米兰体育 细胞外囊泡科普: 为什么莫得70-90纳米好?
下一篇:没有了

备案号: