-
生成式 AI
生成式 AI 时代已经来临:
您准备好了吗?英特尔®集成创新加速
-
-
-
从何处着手
迈入全新生成式 AI 时代
组织和个人都在大规模利用生成式 AI (GenAI),由此产生了巨大的社会影响。消费者级别的 AI(如 ChatGPT 和 DALL-E)凭借其生成内容的能力,俘获了所有人的想象力。与此同时,GenAI 给组织带来的影响有望创造更大的价值,包括提高工作效率、降低成本以及转变我们的工作方式。
-
76% 的 IT 主管认为,生成式 AI 即使不会对其组织产生变革性影响,也将具有重要意义。
76%
GenAI 将推动组织转型
GenAI 不只带来回报,也带来了新的挑战和风险。随着组织竞相踏上 GenAI 旅程,他们不能为了抢先抵达终点,而将客户的信任和组织数据的重大价值置于风险之中,这样容易得不偿失。
76% 的 IT 主管认为,生成式 AI 即使不会对其组织产生变革性影响,也将具有重要意义。76%
-
-
-
成功利用生成式 AI
找到合适的应用场景至关重要。业务和 IT 领导者应根据以下标准优先考虑应用场景:
-
-
-
数据在生成式 AI 中的关键作用
数据和风险形影相随。在数据的推动之下,您的 GenAI 项目将继续向前发展,但您还需要评估在公有云中托管 GenAI 模型的潜在风险,包括:知识产权损失、数据泄露、隐私问题、违反合规性、信誉和诚信损失、偏见和 IP 侵权。
-
-
管理风险并提升价值
在开始您的旅程时,有必要调整技术和培训方面的投资,以提高运营成熟度,降低风险,增强控制,并更大限度地提升组织价值。借助企业就绪型 GenAI,您可以控制谁可以访问您的数据。
-
-
企业就绪型 GenAI 尚未成熟的 GenAI 运营成熟度 风险 图表显示,随着数据处理达到运营成熟度(x 轴),风险(y 轴)会随时间下降。图表斜率的起点代表 GenAI 尚未成熟,风险高且运营成熟度低。图表上的下降趋势表明,企业就绪型 AI 可以降低风险,代表运营成熟度高。
-
-
-
-
-
将 AI 与您的数据结合使用
让生成式 AI 模型贴近您的数据
-
-
了解不同部署选项的风险和优势,对于确定组织如何为 GenAI 分配的理想工作负载至关重要。在将 AI 引入您的数据时,尽管建立 GenAI 大型语言模型 (LLM)(如 Llama 2 或 Falcon)的专用实例可以在速度和部署方面带来优势,但可能也会带来更高的成本和其他缺点。无论哪种方式,相对于您的早期投入,内部 GenAI 都有可能带来更大价值。
在工作负载放置方面,GenAI 与任何其他工作负载并无不同。为取得更好的结果,应根据业务要求和技术需求,将工作负载置于最合适的环境中。
下图描述了在确定 GenAI 工作负载放置时需要应用的概念和框架。
-
-
-
将 AI 融入您的数据的 5 大理由
-
-
-
-
数据驻留位置 成本 更快实现价值 准确性和定制 通用应用场景 安全访问 公有云 私有云 该图表展示了选择 GenAI 工作负载放置在私有云或公共云时需要考虑的六个因素。从“数据驻留位置”和“安全访问”来看,都更偏向于使用私有云。从“成本”来看,比较偏向于私有云,从“准确性和定制”来看,略微偏向于私有云。从“更快实现价值”来看,略微倾向于公有云。就“通用应用场景”而言,非常依赖于公有云。
-
-
面向生成式 AI 的数据管理
大多数组织都在采取双管齐下的方法来实施其 GenAI 战略。他们尝试通过战术部署来开展学习,避免落后他人,同时制定长期战略,以适应随着时间推移而涌现的众多应用场景。这种方法需要双层数据管理策略。
数据准备数据工程 -
-
-
数据准备
-
短期:数据准备
数据准备包括识别数据集和定义数据要求,之后进行数据清理、标记和匿名化处理,然后在数据源之间实现数据规范化。它还需要构建数据管道,以便将数据集成到模型中。
-
-
-
数据工程
-
长期:数据工程
组织需要结构合理的数据存储库(如数据湖或数据湖仓),以便将其数据与 GenAI 模型集成。可以考虑采用迭代方式构建数据湖,以逐步扩展 GenAI 数据存储库的功能,同时团队也能增强其数据管理和 GenAI 技能。
-
-
-
-
-
-
“我们与 Dell Technologies 在此领域展开合作,助力公司利用开源社区的出色创新来构建自己的 AI 系统,同时还能受益于戴尔系统的安全性、合规性和性能。”
-
-
-
-
-
-
您的数据可大幅提高 GenAI 的效率和价值
-
功能有限 规模最小/最具成本效益 领域专业知识 最准确 规模更小 更精准 更多误导性的输出 成本高昂且能耗高 应用场景丰富 通用 因企业而异 因领域而异 大型语言模型 价值 图表显示了 3 种 AI 模型所需的相对数据量及其商业价值。大型语言模型 (LLM) 适用于通用应用场景,使用的数据量最多。它们可能成本高昂且耗费大量能源,并且更容易生成误导性的输出(即幻觉)。因领域而异的 AI 使用的数据更少,但更具体。它的功能有限,但它对您的业务而言更具针对性,价值更高。因企业而异的 AI 使用的数据更少,但最为具体、最准确,可为您的业务提供更大的价值。
-
-
-
AI 部署模式
您选择的 AI 模型将取决于贵组织的数据科学就绪级别、部署模式及其各自的影响。
-
预先训练的模型
此方法称为“提示工程”,涉及向预先训练的模型提出问题并获得结果。
例如,ChatGPT模型增强
通过添加您的数据(例如推理)为 GenAI 模型的答案提供更多上下文,以增强您的 GenAI 模型,其中包括检索增强生成 (RAG) 等应用场景。
微调模型
这涉及调整模型加权并整合您的数据。虽然它有助于改进结果,但在设置过程中也需要投入更多精力。
模型训练
它包括构建特定的模型并使用数据集进行训练。这通常需要投入更多的工作和资源,并且往往用于解决复杂的问题。
工作量 成本 价值和
差异化优势数据集成 基础架构 客户端 — 服务器 客户端 — 服务器 GPU 优化 大型 GPU 部署 技能 IT 运营 开发人员 数据科学家 数据科学家 经过简化的部署参考 经验证的设计 参考设计 经验证的设计 参考设计
-
选择适当的基础架构,打造专属模型
为 GenAI 部署提供支持的基础架构在很大程度上取决于计算要求,这些要求则会受模型类型、模型规模和用户数量的影响。其他考量因素包括在部署、训练和模型优化期间使用的数据所需要的存储容量。
-
通用计算(面向 CPU) AI 优化(GPU 密集型) 戴尔笔记本电脑 Precision 工作站 PowerEdge 机架式服务器 PowerEdge XE 服务器 ObjectScale 存储 PowerScale 存储 PowerFlex 存储 PowerSwitch Z 系列交换机 模型训练 微调模型 模型增强 预先训练的模型 数百万个参数 数十亿个参数 数万亿个参数 用户数量少 用户数量多 这张图表展示了三种生成式 AI 要求并与相应的戴尔硬件解决方案联系起来。硬件解决方案的功能范围很广,从面向 CPU 的通用计算选项到对 GPU 需求密集的 AI 优化选项,应有尽有。具体选项从通用计算端的戴尔笔记本电脑开始,依次是 Precision 工作站和 PowerEdge 服务器,最后是 AI 优化型解决方案端的 PowerEdge XE 服务器。请注意,戴尔存储和网络硬件可在整个范围内使用。三个生成式 AI 基础架构属性映射到这些解决方案,这需要越来越多的处理能力。从使用预训练模型到增强或微调模型,再到训练新模型,模型的复杂性越来越高。参数数量从数百万到数十亿,一直到数万亿。
-
-