随着人工智能技术的发展以及5G时代的到来,内容生产方式开始发生天翻地覆的变化。
从文字、图片到音乐、视频,再到直播、游戏,传统的UGC(用户生产内容)、PGC(专业生产内容)已经无法跟上人们对于丰富内容的需求,新时代互联网人更倾向于选择具有视觉表现力的数字内容。
并且,传统的数字内容生产效率低下,落后的生产方式已经成为了元宇宙内容生产的瓶颈。
随着技术的发展,AI不仅在工业生产与科研场景占据一席之地,也开始为内容创作注入新鲜血液,我们正在目睹各类AI生成技术在各类商业场景中落地,创造越来越多的价值。
最近AI创作频频登上热点话题,大家对它又爱又恨,AI生成内容的火热大家有目共睹。
所有AI玩家当中,最知名的莫过于推出Stable Diffusion开源模型的公司Stability AI。
凭借着广泛的用户人群和强大的技术支撑,Stability AI成为了行业内备受瞩目的“独角兽”企业,而这距离Stability AI成立仅过去两年时间。
Stability AI是一家怎样的公司?为何能成为AIGC领域的“龙头”?其开源产品又将如何引领内容生产中的AI革命?以下我们一一为大家拆解。
Stability AI如何诞生的?
Stability AI的创立理念,是基于一家名为Open AI的公司。
追溯到10年前,AI热度逐渐火热之时,相关的技术研究却受制于有限的算力和资金,对于AI这种新型技术感兴趣的研究人员只能望而却步。
而Open AI的出现为AI研究人员创造了新的可能,这家公司提供了相对自由的研究环境,又有大量的资金与算力做支撑,可以帮助技术研发部门专心深入AIGC领域。
然而好景不长,公司在2020年爆发了内部问题,已经无法支撑非盈利项目的后续运营,这也导致了大批核心研究员出走。
为了延续Open AI的企业价值理念,Emad Mostaque站出来了。
曾在多家技术公司担任工程师、分析师以及投资官等职位的Emad Mostaque决定凭借自己至少20年的投资基金工作经历成立一家和Open AI一样非盈利模式的、同时更加开放的机构。
在2020年,他创办了Stability AI,Mostaque希望其能够延续Open AI的理念并发扬光大,将公司使命定为构建开源AI项目,并在不久后推出了**免费的开源产品模型Stable Diffusion。
Stable Diffusion是一个根据文字生成图片的AI技术模型,只需要几秒钟的时间,就可以生成分辨率、清晰度高,同时不失真实性和艺术性的图片。
该技术模型项目的开发者来自于AI视频剪辑公司Runway的Patrick Esser和就职于慕尼黑大学机器视觉部门的Robin Romabach。
他们从DALL-E2、Imagen等开源模型项目中总结了经验作为项目参考,同时在Stable Diffusion推出时就得到了Stability AI技术团队和外部开发社区的支持。
近几年,AI技术和科研的过程往往都是高度封闭的。
而Stability AI的团队平衡了算力、资金和公众的关系,选择将其代码和模型设计为开源,用户可以在Stable Diffusion代码的基础上构建与设计、增强现实、视频游戏、广告甚至电子商务相关的应用程序,由此成功解决了AI技术封闭的问题。
除此之外,Stability AI甚至为不懂代码的用户提供了无代码的网站供其使用。
凭借着稀缺的开源特征和用户友好的使用体验,项目一经公测就受到大批研究者和用户的欢迎,Stability AI早早积累下了相当规模的用户群体。
同时,凭借积累的人脉,Stability AI在包括学术和工业界的整个AI研究和应用领域都受到了广泛的关注和肯定。Stability AI赋予**的AI模型普适的特点,更多用户都能够享受和利用这项技术。
最初,Stability AI以1亿美元估值完成1000万美元融资。近日,Stability AI宣布获得来自Coatue和光速的1.01亿美元投资,且估值将达10亿美元。
Stability AI表示,公司计划利用这笔融资持续投入研发,并将公司规模从100人扩张到300人。除了Stable Diffusion,公司正在研发用于生成语言、音频、视频和3D的AI生成模型,为未来的内容创作提供更多开源模型。
那么,Stable Diffusion和其他AI开发模型相比有何特别?Stability AI又是如何在竞争激烈的AI市场中崭露头角的?
Stability AI如何崭露头角?
此前,Open AI在今年发布的图像生成器DALL-E2已经拥有超过150万用户,每天创建超过200万张图像;另一款AI生成器Midjourney在其官方的Discord上拥有超过300万用户。
风险投资公司红杉资本表示,AI内容生产能够创造数万亿美元的经济价值。种种迹象表明,AIGC已经成为了未来发展的重要趋势之一。
今年8月,Stability AI发布开源模型Stable Diffusion,这是一个类似于DALL-E2的系统,可以通过文本描述生成对应的图像,而与DALL-E2、Open AI等老牌企业不同的是,它允许任何人在没有监督的情况下使用和构建其模型。
Stable Diffusion开源的底层代码能使得开发者绕开数据方面的限制,实现在其他平台难以实现的功能。
这意味着任何人都可以查看代码并运行修改后的版本,甚至是可以使用该软件为自己的商业产品提供动力。
此外,在其他平台上被禁止的名人画像和敏感图像,在Stable Diffusion平台上也可以被使用。自8月份发布代码以来,已有超过20万人下载了该代码,并使用基于Stable Diffusion算法构建的工具创建了数百万张图像。
然而,2022年8月20日,Stability AI关闭了他们的免费Discord图像生成器,并发布了DreamStudio应用程序。
这是由Stable Diffusion提供支持的新AI系统,可以根据自然语言的描述创建逼真的图像、艺术和动画。
DreamStudio旨在通过自然语言处理和革命性的输入控制的结合,赋予每个人无限想象力和轻松的视觉表达,以加快创造力。
这款面向消费者的产品,目前注册用户已经超过100万,这些用户来自全球50多个国家,共同创建了超过1.7亿张图像。尽管Stable Diffusion模型已经开源,但是DreamStudio作为一项服务,用户必须为生成的图像付费。
每个新用户都会获得200个免费DreamStudio积分的一次性奖励,在默认设置下,每张图片将向用户收取一个信用额度。
DreamStudio会根据用户选择的图像分辨率和步数(大小、配置比例、种子、步数和图像数)来收取积分。一旦免费的积分用完,用户将需要自行购买积分。
Stability AI希望能将权利重新交还给开发者社区,为开创性的应用打开了大门。
Stability AI的创始人兼首席执行官Emad Mostaque表示,“将AIGC交到数十亿人手中将带来新机遇的爆炸式增长。”
Stability AI能成为AIGC龙头吗?
AIGC正成为继PGC(专业生产内容)、UGC(用户生产内容)之后的新型内容创作方式。只需要输入简单的文字描述,AI便能够在几秒钟内自动生成一幅真实的画作,AI技术的发展使得人们的想象逐步成为了现实。
2022年8月,在美国科罗拉多州博览会艺术比赛的数字类别中,一幅AIGC绘画作品《太空歌剧院》获得头奖,同时该画作很快陷入了质疑。
利用AI所创作出的作品能否被认定为艺术品受到了不少人类艺术家们的争论,但是资本与机构的加速入场已经透露出AIGC已然成为了新的风向。
上文我们提到,Stability AI已完成1.01亿美元投资,估值高达10亿美元;而此前,AIGC初创公司Jasper宣布其以15亿美元的估值获得1.25亿美元A轮融资。
除了Stability AI、Jasper这些新晋独角兽,科技巨头也正积极为加入AIGC赛道做准备。
9月,Meta宣布将推出Make-A-Video;10月,谷歌推出Imagen Video和Phenaki,只需要几行文字或是几句话,就可以将想象力带入现实,打造出****的视频。
AIGC的出现可以说是AI算法的一次重大突破,这意味着人类能够利用AI技术持续辅助人类进行内容生产,正如AIGC画作《太空歌剧院》一样,这幅作品不完全是AI创作,也并非作者独立完成。
今年9月,红杉资本联合GPT-3发表了一篇名为《生成式AI:一个创造性的新世界》的文章,其中写道,“人们的梦想:生成式AI将创造和知识工作的编辑成本降至零,生产巨大的劳动生产率和经济价值,以及相应的市值。”
这也意味着,人人都能成为创作者将成为现实,AIGC内容平台将迎来爆发式增长。
从AI作画到AI视频,我们的内容生产创作方式正在发生改变,AI技术正在创意产业中发挥着越来越大的作用。
得益于相关技术的发展与迭代,使得AI可以快速、灵活地生成不同模态的数据内容,而Stable Diffusion的正式开源无疑是拉开了AIGC时代的帷幕,为更广泛的用户提供了重新定义想象力的机会。
Stability AI与其他大型AI公司的“家长式作风”不同,Emad Mostaque通过开源做到了将技术民主化,为那些真正有才华的开发者提供**的自由度,同时,Stability AI还与各国政府和机构开展合作,以便建立更加开放的社区。
Stability AI正在催化其生态系统的发展,然而所有的平台都将向商业化的道路探索,因此能否建立一个良好的商业模式可能将是Stability AI成为龙头的关键,让我们拭目以待。
为什么说AIGC对元宇宙很重要?
全球知名咨询机构Gartner在《2021年预测:人工智能对人类和社会的影响》 中指出,到2023年将有20%的内容被生成式AI所创建。
同时,Gartner还预计到2021年生成式AI产生的数据将占所有数据的10%,而当下这一比例还不到1%,而Gartner所指的生成式AI正是我们现在所熟悉的AIGC。
根据目前的内容生产来看,其实图文和音视频的创作门槛已经因为一些社交媒体的出现而变得简单起来,这也是内容生产力得到解放的重要原因,并由此带来了过去5年短视频的爆发增长。
但另一方面,我们知道,现在一些流行的内容创造方式已经开始从2D转变为3D图像,这在创作上为不少内容从业者带来了门槛。
因此,AIGC的出现可以极大降低这个门槛,并为元宇宙的出现埋下伏笔。
诸如我们熟悉的虚拟人,如果仅仅是依赖人力来创作内容,包括虚拟人的人物创造、环境构造或者虚拟现实的增强都会极大耗费内容创作者精力,因此才出现了像EPIC公司开发的虚幻引擎,来减少虚拟场景的构建时间,但虚幻引擎依然不够友好,毕竟它不是普通人能够涉猎的内容创作方式。
因此,在虚幻引擎的基础上,我们看到了AIGC的诞生,仅仅通过文字描述就能构建我们想要的音频、视频或者画面,这就好比以前耕作需要人力和畜力,但现在我们有了各种播种收割机,必然带来生产力的飞速提升。
我们依然处于AIGC行业发展的早期,甚至我们可以将2022年定义为“AIGC元年”。
而在元宇宙出现之前,AIGC的应用场景其实并没有那么丰富,毕竟大家对当下内容的需求已经足够。
可随着元宇宙的发展和普及,我们发现,内容的构建成本被再次拉升,于是像AIGC这样可以便捷构建内容的方式被关注起来,也由此拉开了新的局面。
可以说,元宇宙和AIGC就像需求和生产力变革的关系,当需求改变时,新的生产方式必然会被得到认可。
当下AIGC的内容生成来说依然存在不少问题,比如内容创作没有边界,存在涉黄涉暴的情况,这也是人工智能与监管者需要寻找的契合点;以及部分AIGC的创作结果存在理解误区,导致出现“苹果长在水里”这样的神奇画面,尽管有趣,但并不符合现实意义,而这也是人工智能需要成长的地方。
不过上述提到的关于AIGC的问题可能并不会妨碍其发展,问题只在于这些“问题”何时被解决,如此,人们对AIGC的关注和使用可能会进一步得到提升。
当然,对于广大内容创作者来说,AIGC既是行业“神器”,也会是行业“利器”,掌握者可能在内容创作中再上台阶,错失者可能被人工智能所抛弃。
AIGC的突然爆红,会让我们感慨似乎站在了一个全新的时代开端上,但某种意义上其实我们也并不知道时代究竟何时到来。
文章标题:新时代互联网人更倾向于选择具有视觉表现力的数字内容
文章链接:https://www.btchangqing.cn/383296.html
更新时间:2022年11月10日
本站大部分内容均收集于网络,若内容若侵犯到您的权益,请联系我们,我们将第一时间处理。