• 生成式 AI

    生成式 AI 时代已经来临:
    您准备好了吗?

    英特尔®集成创新加速
      • 从何处着手

        迈入全新生成式 AI 时代

        组织和个人都在大规模利用生成式 AI (GenAI),由此产生了巨大的社会影响。消费者级别的 AI(如 ChatGPT 和 DALL-E)凭借其生成内容的能力,俘获了所有人的想象力。与此同时,GenAI 给组织带来的影响有望创造更大的价值,包括提高工作效率、降低成本以及转变我们的工作方式。

      • 76%

        76% 的 IT 主管认为,生成式 AI 即使不会对其组织产生变革性影响,也将具有重要意义。

        GenAI 将推动组织转型

        GenAI 不只带来回报,也带来了新的挑战和风险。随着组织竞相踏上 GenAI 旅程,他们不能为了抢先抵达终点,而将客户的信任和组织数据的重大价值置于风险之中,这样容易得不偿失。

        76%

        76% 的 IT 主管认为,生成式 AI 即使不会对其组织产生变革性影响,也将具有重要意义。
      • 成功利用生成式 AI

        找到合适的应用场景至关重要。业务和 IT 领导者应根据以下标准优先考虑应用场景:


      • 人员和团队

        贵组织要做好准备,以把握 GenAI 机遇:IT 部门要着重关注可行性,而业务领导者则应着眼于实现优化和推动增长。

      • 流程和政策

        明确并传达您的组织将如何利用 AI,使其成为日常业务流程的一项关键因素。

      • 科技

        在整个组织中提供安全可靠的 GenAI 访问,避免出现影子 AI 实例,从而确保数据完整性和合规性。

      • 战略

        捕捉环境的当前状况,以确定未来 GenAI 项目的战略愿景和指导原则。

      • 数据在生成式 AI 中的关键作用

        数据和风险形影相随。在数据的推动之下,您的 GenAI 项目将继续向前发展,但您还需要评估在公有云中托管 GenAI 模型的潜在风险,包括:知识产权损失、数据泄露、隐私问题、违反合规性、信誉和诚信损失、偏见和 IP 侵权。

        • 管理风险并提升价值

          在开始您的旅程时,有必要调整技术和培训方面的投资,以提高运营成熟度,降低风险,增强控制,并更大限度地提升组织价值。借助企业就绪型 GenAI,您可以控制谁可以访问您的数据。

      • 企业就绪型 GenAI 尚未成熟的 GenAI 运营成熟度 风险
        图表显示,随着数据处理达到运营成熟度(x 轴),风险(y 轴)会随时间下降。图表斜率的起点代表 GenAI 尚未成熟,风险高且运营成熟度低。图表上的下降趋势表明,企业就绪型 AI 可以降低风险,代表运营成熟度高。
      • 将 AI 与您的数据结合使用

        让生成式 AI 模型贴近您的数据

        • 了解不同部署选项的风险和优势,对于确定组织如何为 GenAI 分配的理想工作负载至关重要。在将 AI 引入您的数据时,尽管建立 GenAI 大型语言模型 (LLM)(如 Llama 2 或 Falcon)的专用实例可以在速度和部署方面带来优势,但可能也会带来更高的成本和其他缺点。无论哪种方式,相对于您的早期投入,内部 GenAI 都有可能带来更大价值。

          在工作负载放置方面,GenAI 与任何其他工作负载并无不同。为取得更好的结果,应根据业务要求和技术需求,将工作负载置于最合适的环境中。

          下图描述了在确定 GenAI 工作负载放置时需要应用的概念和框架。

      • 数据驻留位置 成本 更快实现价值 准确性和定制 通用应用场景 安全访问 公有云 私有云
        该图表展示了选择 GenAI 工作负载放置在私有云或公共云时需要考虑的六个因素。从“数据驻留位置”和“安全访问”来看,都更偏向于使用私有云。从“成本”来看,比较偏向于私有云,从“准确性和定制”来看,略微偏向于私有云。从“更快实现价值”来看,略微倾向于公有云。就“通用应用场景”而言,非常依赖于公有云。
        • 面向生成式 AI 的数据管理

          大多数组织都在采取双管齐下的方法来实施其 GenAI 战略。他们尝试通过战术部署来开展学习,避免落后他人,同时制定长期战略,以适应随着时间推移而涌现的众多应用场景。这种方法需要双层数据管理策略。

        数据准备
        数据工程
        • 数据准备

        • 数据发现

          识别数据集并定义数据要求

        • 数据探索和扩充

          设计和实施数据管道,对数据进行标注、清理、标记和匿名化处理


        • 短期:数据准备

          数据准备包括识别数据集和定义数据要求,之后进行数据清理、标记和匿名化处理,然后在数据源之间实现数据规范化。它还需要构建数据管道,以便将数据集成到模型中。

        • 数据工程

        • 数据接收

          将企业数据集成到大型语言模型中

        • 可观察性和性能

          验证转换后的数据是否符合目标


        • 长期:数据工程

          组织需要结构合理的数据存储库(如数据湖或数据湖仓),以便将其数据与 GenAI 模型集成。可以考虑采用迭代方式构建数据湖,以逐步扩展 GenAI 数据存储库的功能,同时团队也能增强其数据管理和 GenAI 技能。


        • “我们与 Dell Technologies 在此领域展开合作,助力公司利用开源社区的出色创新来构建自己的 AI 系统,同时还能受益于戴尔系统的安全性、合规性和性能。”

          Jeff Boudier, Hugging Face 产品和发展主管
      • 调整 AI 规模

        界定基础架构并调整 AI 规模

      • 75%

        与公有云相比,在本地采用戴尔 AI 解决方案进行 LLM 推理的成本效益可提高多达 75%。1

        凭借您特有的数据,您可以利用特定于领域和企业的应用场景,通过拥有数据专属所有权的任务或功能来创造行业价值。对于不同类型的 GenAI,必须满足相应的门槛和投资要求,才能确保成功。接受过大量文本训练的 LLM 就像百科全书,就一般用途而言很有帮助,但可能并不适合回答关于组织数据的具体问题。

        75%

        与公有云相比,在本地采用戴尔 AI 解决方案进行 LLM 推理的成本效益可提高多达 75%。1
      •  


         
      • 您的数据可大幅提高 GenAI 的效率和价值

      • 功能有限 规模最小/最具成本效益 领域专业知识 最准确 规模更小 更精准 更多误导性的输出 成本高昂且能耗高 应用场景丰富 通用 因企业而异 因领域而异 大型语言模型 价值
        图表显示了 3 种 AI 模型所需的相对数据量及其商业价值。大型语言模型 (LLM) 适用于通用应用场景,使用的数据量最多。它们可能成本高昂且耗费大量能源,并且更容易生成误导性的输出(即幻觉)。因领域而异的 AI 使用的数据更少,但更具体。它的功能有限,但它对您的业务而言更具针对性,价值更高。因企业而异的 AI 使用的数据更少,但最为具体、最准确,可为您的业务提供更大的价值。
      • AI 部署模式

        您选择的 AI 模型将取决于贵组织的数据科学就绪级别、部署模式及其各自的影响。

      • 预先训练的模型

        此方法称为“提示工程”,涉及向预先训练的模型提出问题并获得结果。
        例如,ChatGPT

        模型增强

        通过添加您的数据(例如推理)为 GenAI 模型的答案提供更多上下文,以增强您的 GenAI 模型,其中包括检索增强生成 (RAG) 等应用场景。

        微调模型

        这涉及调整模型加权并整合您的数据。虽然它有助于改进结果,但在设置过程中也需要投入更多精力。

        模型训练

        它包括构建特定的模型并使用数据集进行训练。这通常需要投入更多的工作和资源,并且往往用于解决复杂的问题。

        工作量 较少工作量 中等工作量 较多工作量 巨大工作量
        成本 低成本 中等成本 高成本 巨大成本
        价值和
        差异化优势
        最小价值和差异化优势 中等价值和差异化优势 较高价值和差异化优势 重大价值和差异化优势
        数据集成 无数据集成 数据集成度较高 数据集成度较高 数据集成度非常高
        基础架构 客户端 — 服务器 客户端 — 服务器 GPU 优化 大型 GPU 部署
        技能 IT 运营 开发人员 数据科学家 数据科学家
        经过简化的部署参考 经验证的设计 参考设计 经验证的设计 参考设计
      • 选择适当的基础架构,打造专属模型

        为 GenAI 部署提供支持的基础架构在很大程度上取决于计算要求,这些要求则会受模型类型、模型规模和用户数量的影响。其他考量因素包括在部署、训练和模型优化期间使用的数据所需要的存储容量。

      • 通用计算(面向 CPU) AI 优化(GPU 密集型) 戴尔笔记本电脑 Precision 工作站 PowerEdge 机架式服务器 PowerEdge XE 服务器 ObjectScale 存储 PowerScale 存储 PowerFlex 存储 PowerSwitch Z 系列交换机 模型训练 微调模型 模型增强 预先训练的模型 数百万个参数 数十亿个参数 数万亿个参数 用户数量少 用户数量多
        这张图表展示了三种生成式 AI 要求并与相应的戴尔硬件解决方案联系起来。硬件解决方案的功能范围很广,从面向 CPU 的通用计算选项到对 GPU 需求密集的 AI 优化选项,应有尽有。具体选项从通用计算端的戴尔笔记本电脑开始,依次是 Precision 工作站和 PowerEdge 服务器,最后是 AI 优化型解决方案端的 PowerEdge XE 服务器。请注意,戴尔存储和网络硬件可在整个范围内使用。三个生成式 AI 基础架构属性映射到这些解决方案,这需要越来越多的处理能力。从使用预训练模型到增强或微调模型,再到训练新模型,模型的复杂性越来越高。参数数量从数百万到数十亿,一直到数万亿。
      • 加速您的 AI 之旅

        先人一步,旗开得胜

        对于许多组织来说,检索增强生成 (RAG) 是一个理想的起点,因为它可以在无需重新训练 GenAI 模型的情况下,使用您自己的数据来增强这一模型。探索可用于增强您的业务和数据的 RAG 应用场景的设置。

      • RAG 应用场景

        将 RAG 应用于自定义 PDF 数据集

      • 戴尔经验证的 RAG 设计

        在 Dell APEX Cloud Platform for Red Hat OpenShift 上部署数字助理

    • 1 基于戴尔委托 Enterprise Strategy Group 进行的研究《充分提高 AI ROI:与公有云相比,使用 Dell Technologies 解决方案进行本地推理的经济效益可提高 75%》,比较了本地部署戴尔基础架构与原生公有云“基础架构即服务”和基于令牌的 API,2024 年 4 月。在 3 年内使用 RAG 对小型(5,000 名用户)、中型(10,000 名用户)和大型(50,000 名用户)以及两种 LLM(70 亿和 700 亿参数)的预期成本进行建模。实际结果可能有所不同。经济性摘要