随着中国大模型的迅速发展,面临着五大挑战:技术创新与应用落地的矛盾、数据安全与隐私保护的紧张、高质量数据集的缺乏、算力资源的不均匀分布以及市场与政策环境的不确定性。在这样一个关键时刻,人们好奇地关注着技术的每一步进展,试图找到能够领跑行业的突破性工具。当下,Stable Diffusion 3能力已成为热议的焦点,人们期待它能否在性能上“吊打”Sora,成为新一代模型的标杆。
同时,为了让技术更加贴近实际应用,我们将探讨如何运用Stable Diffusion进行“一键换装”,解锁AI图像生成的新玩法。此外,还将探讨AI PC——AI 终端如何成为我们日常生活和工作的核心场景,其对于算力需求的实时响应以及对数据隐私的本地保护,都预示着AI时代的个人计算将迎来翻天覆地的变化。这篇文章将带您深入这一技术革新的前沿,一起见证和参与AI的未来。
文末附:Stable Diffusion 5个顶流大模型!中国大模型行业的五大问题
电商领域发展现状
在中国,三至五线城镇人群占据65%的比例,这部分人口正成为移动互联网主力军。将近7.2亿用户通过网络参与网购,占据全国网购设备使用数的52%,在电商平台活跃用户中占比高达75%。该现象凸显了线上购物在当代中国社会生活模式中的核心地位,标志着从传统零售模式向电子商务模式的转变。
过去中国零售环境主要依托于传统实体店,但随着电商的到来,商品展示和购物方式都发生翻天覆地的变化。电商平台如同一块巨大电子展示屏,使全国消费者无论在哪一个城市,都能浏览到相同的商品。与此同时,物流服务的进步极大地便利从购买到收货的整个过程,消除地理上的限制,特别是在三至五线城市,使消费者能享受到与一二线城市同样便捷的购物体验。
AIGC在电子商务行业蕴含巨大应用潜力,其能够改变用户的购物体验。通过AI,商家能够将平面的2D商品图像转化为立体3D模型,大大丰富产品可视化效果,提升顾客浏览体验。同时,基于用户购物数据分析顾客偏好,定制化推荐生成与用户兴趣更契合的商品图片,从而提高推荐系统的精准度。此外,AIGC可以辅助创建模拟体验场景,如在线试衣功能或通过上传照片预览家居设计效果,让顾客更直观地看到衣物或家具在实际环境中的搭配效果。还可以在互动营销领域中发挥作用,通过制作个性化头像或表情包等,为促销活动添加创意元素,提升顾客与品牌的互动乐趣及品牌忠诚度。
Stable Diffusion3能否吊打Sora?
Stable Diffusion 最新迭代版本——Stable Diffusion 3,已经正式亮相。该版本同Sora采用相似的尖端技术,均基于Diffusion Transformer架构打造。Stable Diffusion 3在视频生成方面达到当前的技术顶峰,无论是替换不同主题场景,还是创造高清晰度的风景写真,均能轻松应对。其在视频的稳定制作、动态细节捕捉和画面精细度方面都实现了显著进步。
Stable Diffusion 3最让人瞩目的是文字渲染能力。设想下,如果输入一段描述:“桌子上放着一个红苹果,黑板上用粉笔写着'go big or go home’”,Stable Diffusion 3 就能够生成具有电影级质感的图片。
作为一个实验,又输入另一个趣味横生的提示词——“宇航员骑在一头猪背上,猪身披蓬蓬裙,头顶粉红色的雨伞。地面上有带着钢笔迹象的鸟脚印,角落里字样显示 'Stablediffusion’。”生成的结果如何呢?Stable Diffusion 3 巧妙地将 'Stable Diffusion’ 字样自动转变为一种水印式的设计,显示出AI对细节处理的精细。
而当我们用同样的提示词询问 Copilot AI 时,不禁让人好奇——微软的AI又会为我们呈现出何种效果?
在这场美学革命中,Cooperative AI凸显艺术与技术的紧密结合。输入一段充满创造力的文字,轻轻一点,AI便为我们展现一幅幅画面。在其中,有的图像清晰地标有'Stable Diffusion'的字眼,有的则以其令人赞叹的细节处理技术吸引所有目光。Stable Diffusion 3所展现的超高画质和细节表现力,使得每一幅作品都堪称艺术佳作。
当然,还需要提到Google AI在这一领域的贡献。其先进的功能模式能够赋予作品更多的细节和深度,真实感和质感的展现尤为突出。体验Google AI之前,切换到高级模式能让我们享受更精致的效果,尽管目前仅支持英文输入,并且可能会涉及额外的费用,这些都是我们在使用过程中需权衡的细节。
在讨论Stable Diffusion 3所带来的画质突破时,其对细节的专注和精致表现引人瞩目。例如,变色龙特写的精细刻画,则挑战我们的视觉感知,在不同的AI平台之间进行对比。Google AI高级模式所呈现的眼部细节之精确,令人印象深刻;而Stable Diffusion在皮肤质感上的再现同样显现其独到的技术。
AI技术竞赛不仅局限于目前所展现的画面质量和细节之争,更在于不同平台通过细腻独到的技术,赋予生成作品攸关未来的潜力。经过直观体验,可以见证各大平台在生成效果方面的强势表现,各有千秋。
尤其值得注意的是,Stable Diffusion 的开源承诺,有望开启无限的属于公众创造空间。虽然Stable Diffusion 3目前还没有完全对外开放,但其发展进程及团队所采取的安全和伦理措施都显示出了对技术责任的积极担当。团队已经表示,一旦收集到足够的用户反馈并对产品进行充分的优化,最新的模型将会放在开源社区供所有人免费使用,这使得技术和艺术爱好者们对未来充满期待。
Stable Diffusion3
一键换装教程
Stable Diffusion几乎为各种创意需求提供无限可能,无论是更换衣物、模特、背景、头饰,抑或是改变动作,几乎所有能想象到的变化都能轻松实现。要打造这些多变且丰富的效果,可以采用两种主要策略:一是使用图像编辑工具局部重绘功能,二是通过上传重绘蒙版来让创意成真。
一、如何进行局部重绘?
好的创作往往源自灵感的闪现,而AI生成的图像为我们提供广阔的想象空间和创作素材。在利用AI进行创作时,如果有一个由AI创造的参考图,可以通过图片信息功能获取创作该图像所用的参数。包括用于生成图像的提示词、风格、颜色等设定,然后可以用这些参数来在AI中生成新的图片或对现有图片进行调整,这一过程通常被称为'图生图'。
在从图片信息功能转到局部重绘的过程中,原始的提示词可能需要针对特定的编辑目的进行细节上的调整。为保持原有图像的整体风格和感觉的同时,实现局部的变更或增强,需要一定的创意和试验来找到最合适的提示词组合。这个微妙的调整过程涉及到增加新的描述性词汇,或者重新组合和修改现有的提示词,以便给AI提供清晰的指令,从而更加准确地实现创意愿景。
整个过程就像是艺术家在进行精细雕琢,每一处调整都需要以审慎和细致的态度进行,确保最终的作品能够反映出创作者的思考和创作意图。
如果想要给模特的白色衣服上色,将其变为红色,可以通过AI的重绘功能轻松实现。以下是这个过程的具体步骤:
1、打开Stable Diffusion,选择合适的笔刷大小和形状,在模特的白色衣服上用黑色轻轻涂抹。
2、在AI的提示框中输入创意描述,如:“红色衣物”。
3、设置'蒙版模式'(mask mode)和'填充区域'(inpaint area)。'蒙版模式'用来定义想要变色的衣物的边界,而'填充区域'则用来确定想改变整张图像中的所有颜色。
4、完成上述参数设置后,提交命令让Stable Diffusion开始工作并生成新的图像。当获得第一张处理后的图片时,需要仔细审视。如果变色效果不够理想,可以通过增加“红色衣物”提示词的权重或细微调整相关参数,再次尝试生成新的图片。
5、持续实验并细致调整细节,直到颜色达到内心预想的效果。
二、更换模特与背景
要同时更换模特和背景,需要精心设置蒙版模式(mask mode)并合理使用关键词。选用“绘制非蒙版内容”(inpaint not masked)模式是一个非常有效的策略,因为这样可以专注于变更那些没有被蒙版覆盖的区域。
如果想要一个沙滩背景和一个灯塔,只需在关键词中输入相应的内容,如“沙滩”和“灯塔”,AI就能根据这些提示将整个背景更换成期望的场景。另一方面,如果只想更换背景而保留模特,就需要精准地为背景区域绘制蒙版,并且在关键词中仅指定背景的特征,在蒙版模式中选择“仅绘制蒙版内容”。
至于添加发饰,同样需要使用涂抹工具在模特的头部部位上涂抹蒙版,然后加入相应的发饰描述关键词,并选择“绘制蒙版内容”。
AI PC—AI终端核心场景
AI技术在个人电脑(PC)使用中不断融入,借助硬件和软件的共同进步,为用户带来更加个性化和安全的体验。随着硬件提供更充裕的计算支持,以及软件提升了应用界面,PC端的智能化将迅速发展。相较于云端,PC上的AI有几个明显优势:增强数据安全性,保护用户隐私;即时响应,提高系统可靠性;减少成本,为用户和制造商创造双赢情况。
一、AI PC 的必要性:安全、即时、降本
1、云端和本地协同作业, 重塑 PC 使用体验
从智能PC到AI PC的转变,始于2015年左右,当时制造商已经开始探索Smart PC的概念。以微软把Cortana语音助手嵌入Windows系统为例,这一举动为Smart PC的发展奠定了基础。到2021年,英特尔推出的11代酷睿处理器进一步将AI技术集成到日常PC使用中,提供更好的远程工作体验。Smart PC在本地化场景下优化了例如语音唤醒和无接触控制等操作,简化了用户与电脑的交互。
虽然Smart PC成本相对较高,且发展速度因成本和计算力限制而较慢,但随着生成型AI技术发展,云端和本地协作方案让更强大的AI PC功能成为可能。AI PC的发展得益于硬件和软件的协同进步,提升了用户体验。它结合了云端的数据处理能力和本地的应用场景,进一步平衡了性能和成本。
AI PC与云模型相比,提供更高的个人数据安全性,更强的即时响应能力,降低的成本实现用户和制造商的共赢。简言之,AI PC正在改变我们使用计算机的方式,其更智能、安全、高效的特点预示着这一领域的快速发展。
从 Smart PC 到 AI PC
2、安全性增加,满足用户隐私保护需求
AI PC作为本地化的端侧解决方案,可以有效应对以下挑战:
1)保护数据隐私
通常,云模型在特定领域缺乏专业能力,需通过训练大量特定数据来发展该能力。若行业内的企业共享经过训练的模型,则会降低企业间的竞争优势。
2)增强数据安全
随着云端AI应用的普及,例如ChatGPT的辅助工具,数据安全事件逐渐凸显。例如,三星公司允许员工使用ChatGPT不久后,就遇到设备信息和会议内容在内的多起数据泄露事件。2023年3月,ChatGPT在服务中断期间甚至出现了订阅者数据泄露,暴露部分用户的个人信息和付款细节,影响约1.2%的ChatGPT Plus用户。
ChatGPT 数据泄露事件不断出现
商业PC市场的增长与对数据安全性的高需求之间存在着直接联系。随着2023年商业PC出货量激增,预计将达1亿台,构成整体出货量近43%。在此背景下,企业和个人日益寻求既能提升工作效率同时又能保障数据隐私的解决方案。AI PC恰好满足这一需求,通过在本地端处理数据,增加设备独立性,降低数据传输过程中的风险,减少个人信息在云服务中的存储和潜在篡改风险。
云端和本地协同作业
3、可靠性更强,本地端侧能够实现即时响应
云服务的性能往往取决于远端服务器的负载和处理能力。举例来说,像ChatGPT这类产品经常遭遇故障,如错误率升高或服务器宕机,这些问题可能使系统在几小时内无法使用,进而影响用户体验。与此相对,AI PC侧重于本地处理,加上云端协作,可以更快地响应请求并提供稳定服务。
AI PC进一步减少了对网络的依赖,用户即使在离线状态也能操作,摆脱了网络条件的限制。据IDC的研究,用户对AIGC平台的主要抱怨是响应速度和反馈时间,而AI PC凭借与网络质量无关的本地计算能力,可以提供更快捷、稳定的使用体验。
Open AI 产品过去 90 天发生错误事件情况
4、使用成本降低,实现用户与厂商双赢
本地和云端的结合有效降低了AI使用成本。在AI技术初期,用户主要通过昂贵的云服务API接口来访问功能,例如,普通用户使用ChatGPT-4每月需支付20美元且使用受限。而开发者调用API时,成本基于所需的字符数计算,费用较高。AI PC的出现,通过在本地端处理基础任务和将复杂任务交由云端强大模型完成,有效地减少成本。
对开发商而言,AI PC同样带来经济上的好处,他们可以通过在本地处理部分任务来降低云端算力的成本。例如,ChatGPT的日常运营成本高昂。通过AI PC的本地处理优势,开发商能够减少对云服务器的依赖和相关支出,特别对于预算有限的小型开发商而言,AI PC是一个更佳的选择。同时,本地化模型也为开发者提供丰富的资源,使他们能更灵活地开发创新应用。
从整个PC行业发展的视角来看,AI PC正处于从技术突破到产品实现再到生态形成的过程中。算力和算法的进步推动了AIPC对高性能低功耗处理的需求;芯片制造商正在推出专门为AIPC优化的产品;整机制造商积极布局市场;同时,底层算力提供商基于现有优势推动行业协作,生态正在逐步构建,包括AI软件和操作系统等领域。
ChatGPT 产品价格
二、技术端:算力提升与算法改进推动 AI PC 发展
AI PC通过结合CPU、GPU和NPU等多样化处理器进行异构计算,分别处理串行和并行任务,有效提升了计算能力和效率,同时降低能耗。与更新硬件的ASIC架构相比,异构计算降低成本。这种计算方式还能迅速适应新的神经网络算法,提供一种经济高效的技术解决方案,以应对技术的快速变化。
AI PC 支持 CPU、GPU、NPU 在内的异构计算
AI PC通过模型蒸馏和压缩技术实现高效算法部署,满足用户对AI的需求。硬件限制下,这些技术将大型模型缩减适配移动和IoT设备,以进行快速本地响应。模型蒸馏从“教师”转移知识到体积更小的“学生”模型,保持高性能。模型压缩如剪裁和量化简化模型结构,保留主要功能。比如,联想提到的技术评估并精简参数,动态优化性能。这些方法不仅减小了模型尺寸,还利用云端AI支持,确保个人模型在各种场景下都能高效运行。
模型蒸馏框架
三、未来展望:行业周期向上,AIPC 或成 PC 行业重要发展动力
1、产业进入换机周期,PC 行业出现周期性拐点
PC行业正面临周期性的更新转折点。市场趋势受宏观经济、产品更新、在线需求变化(例如疫情带动的远程工作)及固有的4-5年更换周期影响。疫情期间,PC需求上涨,但随后市场增长放缓。IDC数据表明,从2021年第一季度到2023年第一季度,全球PC出货量呈现下降趋势。不过,近期出货量稍有复苏,2023年第四季度全球PC出货量稍好于预期,较去年同期下滑2.7%。由于疫情期间购入的PC设备已临近更换周期,市场收缩接近底部,预计到2024年市场将回暖并实现增长。
全球 PC 年度出货量及增速
1)换机驱动之一:2025 年微软停止支持 Win10
随着Win10的即将停更和Win12的推出,预计将在2024-2025年掀起电脑换机热潮。Win10目前占据市场主要份额,但支持该系统的电脑在2025年之后将不再更新,促使用户升级设备。同时,AI PC的兴起预计也将推动市场发展。随着商业需求的回升,AI PC可能在2024年迎来新的增长机遇。预测显示AI PC市场渗透率将在未来几年显著增长,尤其在商业应用方面。基于当前数据和智能手机历史渗透率,估计到2028年,AI PC可能会占据市场的主导地位。简而言之,系统升级和AI PC技术革新预计将是未来PC市场增长的两大驱动力。
2、联想:PC 业务复苏领先市场,期待 PC 周期复苏及 AI PC 渗透拉升业绩
联想集团在2024财年第三季度业绩显示,收入同比小幅增长3%,达到157亿美元,并连续三个季度环比增长;纯利润同比下降23%,为3.4亿美元,但环比提升35%,超出预期。从这些数据能看出,尽管PC行业整体下滑,联想的PC业务却实现了复苏,出货量超过市场平均水平,市场份额有所增长。非PC业务的收入增长也表明公司正在多元化。联想在PC市场的复苏表示整个PC行业有望好转。
联想集团 IDG 业务收入及增速
联想集团的经营利润率在最近一个季度有所增长,达到3.9%,比前一季度提高了0.3个百分点。这一增长主要得益于企业减少财务成本及改善运营效率,尤其是通过降低负债和管理费用。其IDC业务的利润率也有小幅增长,达到7.4%,归因于高端产品比例的提升和北美及中东市场的强劲增长。简而言之,联想通过成本控制和产品结构调优,提高其盈利能力。
联想集团 IDC 业务经营利润及利润率
在最近的CES展会上,联想推出了多款AI技术驱动的新设备和解决方案,其中包括超过10种AI PC产品,这些预计将为其IDG业务带来持续的增长。虽然传统淡季可能会对2024财年第四季度的PC销售产生影响,但预计下半年的增长速度将超过上半年。增长的主要动力来自于AI PC在国内的推广以及其全球发布,商业客户的试用阶段将带动后续的订单增长,以及Windows11用户的潜在换机需求将在未来半年内促进市场活跃。简言之,AI PC的推广和新系统的更新将是联想下半年增长的关键。
四、蓝海大脑PC集群解决方案
在当今计算领域中,PC集群和Stable Diffusion技术的应用已经成为不可或缺的一部分。这些技术在深度学习、AI绘画、高性能计算、人工智能、大数据、ChatGPT、AIGC等领域中都具有重要的应用价值。特别是在AI生成式内容创作方面,使用PC集群和Stable Diffusion技术可以有效解决大型计算任务所带来的挑战,并实现高质量的生成式AI内容。
通过结合这些技术的创新应用,可以更好地利用大规模的训练数据来调整和训练生成式AI模型,以提高其生成质量和准确性。同时,借助创新的加速技术和稳定扩散模型,可以提高AI生成式内容的生成速度和质量。比如,使用PC集群和Stable Diffusion技术配合AI生成式技术可以快速地生成高品质的图像、视频、音乐等内容,节约用户时间和精力,提高生产效率和创作效果。
另外,在企业和办公室环境中,PC集群也是一种非常有效的计算资源管理方法。该方法将任务分解成小的子任务,并分配给不同的计算节点进行处理,提高了计算效率和速度。通过使用PC集群,企业可以降低硬件和维护成本,并实现更高的计算性能和吞吐量,以满足不同任务的需求。同时,PC集群还具有容错机制和易于管理的优点,使得企业能够保持高效的生产和数据访问,减少停机时间和数据丢失风险。
蓝海大脑PC集群解决方案提供高密度部署的服务器和PC节点,采用机架式设计,融合PC高主频和高性价比以及服务器稳定性的设计,实现远程集中化部署和便捷运维管理。采用模块化可插拔设计,简化维护和升级的流程。有效降低网络延迟,提高游戏的流畅性。GPU图像渲染加速,减少画面卡顿和延迟。同时动态调度算法,实现负载均衡;大幅降低运营成本。高品质的游戏体验增加用户的粘度,大大提升游戏运营商收益。
集成Stable Diffusion AI模型,可以轻松地安装和使用,无需进行任何额外的配置或设置。
Stable Diffusion
5个顶流大模型
下面将要介绍五个极其实用的Stable Diffusion大模型。这些模型是提高AI绘图效率的必备工具。不仅可以生成逼真的人物模型,还能绘制出细腻到几乎无法分辨真假的图片,并且能够创建复杂的二次元插画和国风大模型等。
一、容华国风大模型
首先,需要在软件界面的右上角加载模型。加载完成之后,返回软件起始界面,向下滑动至参数设置区域。此时,只需简单地点击右上方的代码全选按钮,并复制这些代码。接下来,回到之前的页面,在提示栏使用右键粘贴选项,这样参数就自动填充好了。
之后点击下载箭头符号,让系统自动配置好各项操作参数。默认情况是生成一次,且每次只产生一张图片。如果需要更多图片,可以在此调整生成数量。调整完成后,滑回页面顶部,并点击生成按钮。通常来说,图片的生成过程大约需要两分钟。待生成完毕后,可以立即预览新鲜出炉的图像效果。
如果是初次安装,软件可能会提醒尚未安装4X Upscale的高清化算法。私信下方小助手可获取文中模型下载链接,将算法文件放置在指定的ESRGAN文件夹下即可。
二、超逼真的人物模型
超逼真的人物模型以生成极具真实感的人物形象著称,使用这个模型的步骤非常直观。首先,下载该模型,并将其放入Stable Diffusion软件的model目录下。模型下载完毕,打开Stable Diffusion的根文件夹,进入model文件夹,并将下载好的模型文件拖入其中。
接下来,下载必要的额外文件,并确保被正确地放在软件的相应文件夹内。一切准备就绪后,回到生成面板,刷新模型列表,这样新模型就会出现在列表中,并准备就绪。模型加载后,将页面下方提供的参数复制到提示栏中。当导入所有生成参数并选择了合适的高清化算法后,按下生成按钮,稍等一会儿,精美的人物画像便呈现在眼前。
三、EpiCRealism 冠军级真人模型
可以生成超逼真的人物形象。下载并安装模型后,重复前面的步骤来生成图片。
四、DarkSushi 模型
专门用于绘制3D卡通IP设计的模型。下载后,将其放入指定文件夹,加载模型后可以尝试生成图片。
五、DynaVision XL 专为绘制3D卡通IP而设计的模型
特别适合绘制复杂场景中二次元插画,并能够展现出漂亮的光影效果。下载安装后,放入模型文件夹中,加载后就可以开始体验。
中国大模型行业的五大问题
随着 OpenAI 发布的GPT模型,国内许多科技公司也相应推出各自大模型产品。截至2023年年底,中国推出的大模型总数已超过130种。此前对人工智能模型的态度由观望转为积极,几乎所有业内人士都开始认可并赞同大型模型的发展趋势,并加快步伐以期不被市场淘汰。对于未来投入,包括算力、数据以及人才三大方面均已得到充分确认。中国企业在工程技术方面的专长让人们对推出实际可用的大模型充满期待。那么,事实究竟如何呢?
OpenAI 从一开始就将大模型视为核心发展方向,并大量投资在算力之上。据第三方数据机构 SemiAnalysis 估算,OpenAI使用约3617台HGX A100服务器,包含近三万块NVIDIA GPU。除此之外,微软还协助OpenAI建立专门针对大模型的定制化算力集群,以进一步提升GPU的使用效率。
在数据方面,OpenAI 在数据收集、数据标注、数据清洗、数据整理、数据优化等环节进行持续的投入。在人才方面,OpenAI 团队成员主要来源于全球顶尖的科研机构和科技巨头公司。尽管具备强大财力和投入,OpenAI 也用超过八年时间才研发出革命性产品GPT-4。该产品虽然突破了许多界限,但仍存在一些无法彻底解决的问题,如所谓的幻觉问题。然而,有中国公司宣称仅用几个月的时间就开发出匹敌GPT-4的大模型,这引起了行业的广泛质疑。
自2023年下半年以来,有报道指出一些中国公司的大模型实为套壳,即直接使用国际上的开源模型并进行重新包装。在一些评估大模型性能榜单中,部分高排名模型的性能指标可与GPT-4媲美。这些高性能模型的套壳比例也相应较高,若经调整容易导致性能下降。这些现象折射出中国大模型产业面临的模型、算力、数据、资本及商业化五大问题。这些问题互相关联,互为因果,无法独立解决。预计在2024年这五大问题将更加明显。
一、模型本身
2023年11月,李开复推出的零一万物模型因相似于LLama模型而受到外部质疑,批评者认为该模型只是对已有模型进行细微修改并重新命名。针对这些质疑,零一万物回应,其在模型训练过程中确实利用开源架构进行效果对比,并使项目得以迅速展开。此外,该团队强调发布的Yi-34B和Yi-6B模型是全新训练出来的,其中集成众多原创的优化方案和技术突破。
另一报道称,2023年12月字节跳动在大模型研发项目中使用OpenAI的API和GPT模型产生的数据,而这一做法未获得授权,违反OpenAI的使用条款。因此,OpenAI暂停涉嫌违规的账号,并宣布将启动进一步的调查。如证实违规,OpenAI会要求字节跳动更改使用方式或终止相关账号。作为回应字节跳动方面解释说,在2023年初,其技术团队在进行大模型早期研究时,确实利用GPT的API服务用于支持内部的小模型测试项目,但这些测试并未面向公众使用。此外还指出,自2023年4月以来公司已经引入GPT API使用规范的检查机制,确保此类使用不再发生。
二、算力
NVIDIA A100芯片历来被视为训练大模型的理想之选。继A100之后,NVIDIA推出性能更强的H100算力芯片,然而这款新芯片目前在中国市场无法购得。即使在2023年A100的市场价格翻了一番,中国大型企业如阿里巴巴、腾讯、字节跳动和百度等,仍然因其实际业务需求而大量采购芯片。与此同时,较少有从事大模型开发的初创公司选择与NVIDIA展开所谓的战略合作,来标榜其在算力上投入;相反,更为常见的做法是参与不涉及财务往来的合作模式。
尽管面临美国政府的出口限制,中国公司仍有途径利用NVIDIA强大算力。除直接采购外,还可以通过NVIDIA在中国设定的合作伙伴获取。不容忽视的是,GPU本身的昂贵价格以及随之而来的部署、运维、调试和维护等后续成本也是一笔不小的开支。例如,运营一台配备八张A100卡的DGX服务器,消耗的电力和散热所需能耗都是巨大的。以每小时6.5千瓦的功率计,24小时运行下的电费约200元人民币,若企业运营1000台类似服务器,则每日电费可高达20万元。对于初创公司而言,大量投入算力并不是可行的策略。
三、数据方面
数据和算力被称为大模型发展的双翼,中国在获取底层数据方面门槛相对较低,过去常依靠爬虫工具,现在则趋向使用开源数据集。然而,国内大模型发展侧重中文数据,而业界对于中文互联网数据质量普遍持保留态度。许多中国AI从业人员在追寻高质量专业信息时,往往会首选Google搜索、arXiv学术库或是YouTube视频,而不是百度搜索。
OpenAI在建立大模型时也处理过中国网络平台数据,但不只是简单的数据标注,而是需要进行深度的数据清洗和整理。国内AI企业界的领袖们指出,寻找规范化数据服务的公司在中国并不易,大多数服务要么价格高昂,要么定制化服务,这样的成本对于大多数公司,尤其是初创企业来说,并不划算。昂贵的数据投入如果不能带来预期的模型性能提升,便是一场空欢喜。因此,很多公司宁愿借助开放来源数据进行模型训练,并在发布会上进行宣传。
在数据保护领域,中国市场仍存在不足。某知名企业AI部门负责人曾透露,国内的数据如果你能够获取,别人同样可以,这意味着你投入巨资构建的高质量数据集,别人可能轻松以较低成本获取,反之亦然。在数据领域,超越算力资源投资所面临的挑战或许更大。目前为止,中国尚未出现数据处理行业的领头羊,如Scale AI。通常数据清洗工作在中国并不被重视,这使得初创公司很难在获取高质量数据与保持低投资成本之间找到平衡。于是,模型优化成了他们难以企及的梦。
四、资本
尽管OpenAI已经开辟一条明确的道路,但对绝大多数公司来说,要从零开始打造成熟的大模型,所需的成本和时间巨大。对于大多数投资者而言,每笔投资目的非常明确:实现退出机制并赚钱。OpenAI的成功,估值一路上涨,预计未来还会持续增长。截至2023年四月份,OpenAI的估值约为280亿美元。到目前,OpenAI最新一轮的估值已经达到1000亿美元。
投资界对于中国大规模模型初创企业的信心正逐渐增强,只要投资价格合适,预计在较短的时间内就能够见证投资估值显著上升。不过,中国投资者通常只愿意等待3到5年的时间。创业企业的早期融资主要依赖于市场趋势和吸引力故事,但一旦发展到中后期尤其是准备上市,企业必须证明其商业化潜力。随着时间推移,通过公开市场或并购途径退出变得越来越困难。
这种现象不难解释为何在2023年,我们会看到众多围绕大规模模型开展的发布会,以及接连不断涌现的各种相关排行榜单,其中的排名标准也千差万别。其背后的本质是为了讲述一个吸引人的故事,目的无外乎是为赢得融资。
如今,在中国绝大部分专业投资机构都转为人民币基金,而美元基金几乎已退出市场。而人民币基金的资金大多来自地方政府,募资时往往伴随着行业限制、反投资和预期回报条款。在这种情况下,像OpenAI那样前期默默沉淀七八年的例子,在现金流紧张的环境中几乎不可想象。一旦创业公司拿到资金,就必须开始为回本和盈利奔忙。
五、商业化
AI商业化正成为一股不可逆转的潮流,2023年国内AI大模型行业从追求技术高参数过渡到更重视商业应用的实际转化。今年1月的CES大会上,知名AI领域学者李飞飞和吴恩达提出,AI的商业化将进一步扩展至各个领域。目前,大型模型主要被用于以下方向:一是向C端用户提供基于AI新型应用工具,如GPT-4付费版本、百度文心一言等;另一方面,B端市场潜力更大。在中国,为企业提供B端软件服务一直是一项挑战,特别是当客户群体主要以政府和国有企业为主。
另外,有创业公司的开发者在探索与中小企业合作时,面临企业客户询问的实际问题:AI大模型具体能为企业带来什么样的实际好处?是降低成本还是增加收益?这些都是创业公司需要解答的问题,也是其目前需要面对的挑战。
在认识AI大模型现状及其发展趋势时,我们必须保持清醒头脑和理性思维。AI大模型技术虽不断进步,但在“幻觉”方面仍有许多挑战需要解决。在特定的领域,幻觉问题可能阻碍AI的实际应用。例如,和传统对比数据的AI技术(如人脸识别)不同,大模型有时会产生误导性的陈述或者错误解答,这样的误导问题不易被发现和纠正。
六、2024年AI大模型发展趋势
1、融资热度逐步下降。与2023年频繁爆出高额融资势头不同,大模型创业公司需要思考如何寻找新的发展道路。
2、大模型的应用继续深化,主要集中在数字化程度高、业务量大的领域。在C端市场,大模型预计会进一步普及。然而,对于中国公司而言,不能仅依赖C端用户付费,还应拓展多样化的变现模式,如融入广告等。
3、国产算力将受到进一步的重视。不过,提升国产算力是一个长期的过程,并非一蹴而就。
同时,也必须警惕那些借势炒作、圈钱的现象。类似最近的AI割韭菜第一人'李一舟'及'贺老师'等的翻车案例,时刻提醒着我们产业快速扩张与泡沫的并行存在。真正的机会往往隐藏在泡沫之后,需要去发现和挖掘。
高性能计算群,聚焦算法、开发、科研及求职等话题。群里大咖云集,欢迎添加小助手微信18911232010,快快加入吧~