音乐创作和撰稿模拟位数相片将变得更容易。 美国纽约人工智慧子公司OpenAI宣布,其合作开发的此款人工智慧控制系统能根据对物品或情景的描述,自动聚合高度精巧的相片。该子公司与谷歌(Microsoft)同为。通过该控制系统还能采用单纯的辅助工具撰稿相片和修改文字,不须要采用者通晓Photoshop或位数艺术专业技能。 参与此项目的OpenAI研究员克雷格·维尼县则表示:“我们希望这类辅助工具能让其他人都有潜能音乐创作自己想要的相片。”他则表示,该辅助工具对于商品雕塑家、杂志宣传照雕塑家和音乐家都有很大帮助,能用来启迪意念和进行头脑龙卷风,或是直接用作音乐创作最终作品。他还则表示,电子游戏子公司也能采用应用应用软件聚合情景和角色,尽管它现阶段根本无法聚合动态相片,无法聚合动画电影或音频。 此款应用软件更容易被用作聚合种族歧视梗图或是音乐创作不实相片,作为宣传册或传播不实信息,甚至被用作制作色情相片,因而OpenAI则表示已经采取行动限制该软件在这方面的潜能,首先是从人工智慧培训数据中删掉这些相片,并对人工智慧聚合的相片进行如前所述规则的筛检和人工内容审查。 OpenAI也在非常谨慎地控制新人工智慧的正式发布,该子公司则表示应用应用软件现阶段只是一个研究项目,并不是此款商业性商品。该子公司现阶段仅向经过精心设计甄选的IOS波季尔分享应用应用软件。但OpenAI之前如前所述语义处理合作开发的开创性技术,在约18月内便被应用作商业性商品。 OpenAI合作开发的最新应用软件名叫DALL-E
2,是其2021年初正式发布的DALL-E控制系统的改良版。(第一个字母简写较为繁杂,它会让人们想起梦工厂(Pixar)著名动画电影片中的机器昂西桑县(WALL-E),然后用天马行空主义音乐家危地马拉·利维的英文名字玩了一个无厘头,而该控制系统聚合的相片确实是天马行空的,因而这个英文名字很有意义。) 第一卷DALL-E根本无法聚合卡通相片,通常采用单纯大背景。旧版DALL-E 2能在繁杂大背景下聚合照片品质的高分辨率影像,有对比度效果、真实的光线、阴影和倒影等。 DALL-E
2让相片撰稿变得更容易。采用者能用方框圈出相片中希望修改的部分,然后用语义指令说明其希望进行哪些修改。例如,你能框住柴犬的贝雷帽,然后输入命令“将贝雷帽变成红色”,它就会自动变色,但不会改动相片的其他部分。此外,DALL-E
2还能聚合同一张相片的不同风格,采用者同样只须要输入纯文本命令即可。 OpenAI所做的测试显示,如果采用者在物品上添加的文本标签与实际不符,这种行为不太容易骗过DALL-E
2采用的字幕和相片分类算法。例如,之前将文字与相片关联的算法如果在接受训练时被展示的是一张苹果的相片和写着“披萨”的文字标签,那么它可能会将相片误认为是披萨。而DALLE-2采用的算法不会犯同样的错误。它依旧会将相片中的物品识别为苹果。 OpenAI联合创始人兼首席科学家伊利亚·萨茨克尔则表示,DALL-E
2是OpenAI实现创建通用人工智慧(AGI)这一目标的重要一步。通用人工智慧应用软件在多类任务中能有不亚于人类甚至胜过人类的表现。萨茨克尔则表示,通用人工智慧须要处理“多模态”概念理解,能够将一个词与相片或一组相片相互关联。他则表示DALL-E
2就是创造具备这种理解潜能的人工智慧的一次尝试。 OpenAI曾尝试通过语义处理创造通用人工智慧。该子公司合作开发的此款商业性商品是支持其他子公司访问GPT-3的编程界面。GPT-3是一个庞大的语义处理控制系统,能撰写大段小说文字,还能执行翻译、汇总等许多语义任务。 当然,DALL-E
2并不完美。该控制系统有时候无法聚合繁杂情景下的细节。某些光影效果可能会有偏差,或是模糊两个物品之间本应泾渭分明的边缘。另外,与其他多模态人工智慧应用软件相比,它在理解“绑定属性”方面并不擅长。如果你发出指令“在蓝色立方体上面的红色立方体”,它有时候会错误聚合红色立方体位于蓝色立方体下方的相片。(财富中文网) 译者:刘进龙这张经典风格的海滩上的科伏翼模拟相片,出自OpenAI的敞篷版影像聚合人工智慧应用软件。采用者只须要输入命令“一只在海滩上的科伏翼”,剩下的工作交给人工智慧即可。此款新控制系统名叫DALL-E 2。相片由OPENAI的DALL-E 2提供。
OpenAI的DALL-E 2影像聚合应用软件音乐创作的柴犬相片。相片由OpenAI DALL-E 2提供。
推荐阅读