面对无限可能,我们只需要充满期待。
Openai又推出了一部大片。
本月初,去年夏天推出流行语言模gpt-3的openai研究小组再次宣布推出一款名为dall-e的新人工智能模,虽然没有gpt-3那么火爆,但它很可能对人工智能未来的发展产生更深远的影响。
总之,dall-e可以将文本描述作为输入,生成相应的原始图像输出。(dall-e这个名字来源于对超现实主义艺术家El Dali和皮克斯工作室创作的可爱机器人形象Wall-e的致敬。)
例如,当您输入“五边形绿色时钟”、“火球”或“建筑物墙上的蓝色南瓜壁画”时,dall-e可以产生惊人准确的视觉效果。
在需要生成“建筑墙上的蓝色南瓜壁画”后,openai的新深度学习模dall-e可以生成上述原始图像
为什么dall-e很重要?
首先,它标志着一种新的人工智能范式“多模态人工智能”的出现。这种范式似乎代表了人工智能的未来。以dall-e为例,多模式人工智能系统能够解释、综合和翻译多种信息模式,从而映射情境、语言和图像。虽然dall-e不是第一个多模人工智能解决方案,但它具有迄今为止最惊人的实际效果。
openai的联合创始人伊利亚•萨茨凯总结道:“世界不仅仅是由文字组成的。除了表达,人类还诉诸于视觉。视觉元素非常重要。”
大多数现有的人工智能系统只能处理一种数据类。自然语言处理模(NLP模,如gpt-3)只能处理文本;计算机视觉模(如人脸识别系统)只能处理图像。但人脑所表现出的智力显然更具适应性,它所能处理的信息也更具灵活性。
人类可以不断地接收和整合来自五种感官的信息——我们通过视觉、听觉、触觉、嗅觉和味觉的结合来了解我们周围的世界。在此基础上,我们还以声音、文字、身体表情、面部表情、音乐等形式将信息传回这个五彩缤纷的世界。
通过将自然语言理解与视觉表征生成相结合(即“阅读”与“视觉”相结合),dall-e再次展示了多模态人工智能的巨大潜力。
这只是个开始。在未来几个月甚至几年,新的人工智能系统有望无缝连接音频、视频、语音、图像、文字、触摸和其他元素。随着人工智能学会以越来越复杂的方式组合多种信息,其理解世界和产生新见解的能力将爆炸式增长。
dall-e还有另一个,或者说更根本的意义:人类越来越无法否认人工智能所蕴含的巨大创造力。
dall-e所产生的图像远远超出了人类的想象范围。这不仅仅是对互联网上现成图片的简单修改——相反,这些都是****的渲染,其中的独创性和独创性足以让艺术家赞叹。事实上,即使是dall-e的创造者也常常不能理解它的生成原理。
让我们来看看戴尔的一些作品。第一个是“一碗拉面表情”,第二个是“鳄梨企鹅”。如果这些成就来自人类设计师,我们无疑会把它们视为真正的创意产品。在这种情况下,我们有什么理由否认或拒绝dall-e?
dall-e根据“一碗拉面”输出的图像
图片
由dall-e从“鳄梨做成的企鹅”生成
有了这种强大的创造力,dall-e可以证明人工智能技术在产品设计、时尚、建筑等领域的现实意义。比如**系统,甚至是设计人员的灵感来源。
例如,在设计“甜甜圈式扶手椅”时,dall-e带来了多种构图选择。当然,它的设计和外观都是高标准的。不难想象,未来一些家具设计师会反复使用dall-e来探索模输出,调整输入文本进行设计迭代,**将人工智能元素引入作品。从汽车到灯具,从珠宝到房屋,类似的创作过程将适用于许多产品。
dall-e根据“甜甜圈式扶手椅”生成的输出图像
当然,dall-e还远远不够完美,它生成的图像并不总是准确地表示输入的文本:例如,它经常在颜色、数量或空间关系上出错。
利用clip神经网络对openai发布的All-E工作实例进行分类筛选。对于每个文本输入,系统将只显示512个样本中置信度**的前32个样本。换句话说,dall-e实际上生成了更多的图像,但大多数图像效果不好。
总而言之,dall-e的创造力是惊人的,技术本身仍处于快速迭代中。
与人工智能技术的其他重大发展一样,dall-e再次提醒我们一个老问题:机器的智能水平是否越来越接近人类?
一方面,dall-e的诞生激发了人们对超智能技术的夸大言论。另一方面,以**的深度学习批评家加里·马库斯(Gary Marcus)为代表的怀疑论者认为,dall-e并没有给人工智能技术的发展带来任何真正的动力。
马库斯的观点值得认真对待。深度学习(包括为DALE E和GPT-3提供基础的前沿变压器体系结构)在智能概念建模中仍然存在严重的局限性。
但在某种意义上,这场争论实际上偏离了真正的观点。无论openai的新模式是否代表着迈向“通用人工智能”的下一步,无论深度学习能否真正带来与人类认知水平相同的机器智能成果,dall-e本身仍然拥有非同寻常的新能力已成为不争的事实。
DALE E及其后续项目有望为人与机器之间的创造性关系带来新的可能性,从而获得巨大的经济价值,为新一轮创新初创企业和产品奠定基础。
面对无限可能,我们只需要充满期待。
文章链接:https://www.btchangqing.cn/182188.html
更新时间:2021年01月20日
本站大部分内容均收集于网络,若内容若侵犯到您的权益,请联系我们,我们将第一时间处理。
该埋伏的早都埋伏完了,现在冲就是韭菜。
合规溢价权
这两天开始阴跌了,再出个利空,暴跌,等着吧
比特铁粉来也
熊二而已,熊三还没出现。现在看多要做好多次腰斩的准备
比特币勤奋真能造就财富吗?比特币
感謝樓主区块链