ChatGPT原理与架构:大模型的预训练、迁移和中间件编程在线阅读
会员

ChatGPT原理与架构:大模型的预训练、迁移和中间件编程

程戈
开会员,本书免费读 >

计算机网络人工智能10.6万字

更新时间:2024-04-25 18:20:57 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

同类热门书

最新上架

  • 会员
    本书立足于AIGC技术前沿与发展趋势,全面阐述了AIGC的概念内涵、底层技术与应用场景,详细梳理全球科技巨头在AIGC领域的战略布局,并辅之以大量生动有趣的案例,深度剖析AIGC在各行业领域的应用场景,旨在引导读者真切感受AIGC革命浪潮蕴含的商业创造力。全书分为五个部分,共18章。第一部分主要厘清AIGC技术的起源与演变,阐述席卷全球的AIGC背后的技术架构以及AIGC的应用场景;第二部分重点剖
    杨爱喜 胡松钰 陈金飞计算机11.4万字
  • 会员
    本书主要从软件开发者的角度探讨如何构建和设计深度学习系统。作者首先描述一个典型的深度学习系统的整体,包括其主要组件以及它们之间的连接方式,然后在各个单独的章节中深入探讨这些主要组件。对于具体介绍的章节,会在开始时讨论需求,接着介绍设计原则和示例服务/代码,并评估开源解决方案。通过阅读本书,读者将能够了解深度学习系统的工作原理,以及如何开发每个组件。本书的主要读者对象是想要从事深度学习平台工作或将一
    (美)王迟 (美)司徒杰鹏计算机18.1万字
  • 会员
    本书通过对10款人工智能应用的介绍及调试,帮助读者快速掌握人工智能辅助文案变现的方式。本书共10章,分别讲解AI智能创作,AI爆款文案写作工具,人工智能辅助泛流量文案、泛商业文案、私域文案创作,利用人工智能实现文案变现的底层逻辑,以及在今日头条、百家号、小红书、知乎等平台及不同展示形式下进行文案创作的实战案例等。
    刘丙润计算机12.2万字
  • 会员
    本书以ChatGPT为核心工具,揭示了人工智能技术对架构师的角色和职责进行颠覆和重塑的关键点。全书通过共计13章的系统内容,探讨AI技术在架构设计中的应用,以及AI对传统架构师工作方式的影响,读者可以了解如何利用ChatGPT这一强大的智能辅助工具,提升架构师的工作效率和创造力。
    关东升计算机7字
  • 会员
    本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7
    张萌 李小武 兰洋 陈中泽等计算机23.8万字
  • 会员
    本书介绍提示工程的基本概念和实践,旨在帮助读者了解如何构建高质量的提示内容。内容包括:认识大语言模型、ChatGPT应用体验、ChatGPTAPI、PythonChatGPTAPI库、提示工程、提示类型、基于提示工程应用Python数据分析等。
    兰一杰 于辉计算机14万字
  • 会员
    本书是一本深入探讨AI在论文写作中应用的指南。本书通过九章内容,全面介绍如何在论文选题、前言写作、大纲写作、正文写作、数据分析、摘要写作、结语撰写、文稿翻译与润色、答辩PPT制作、查重投稿等环节借助AI提高效率和质量。本书不仅讨论了AI的使用伦理,还针对论文写作的具体问题,提供了提示词示例(已全部收录到秋叶AI智能鼠标平台),为论文写作提供了广阔的视角和新的方法。本书可作为缺少学术论文写作经验的大
    秋叶 佘有缘计算机7.3万字
  • 会员
    本书共分为8章,涵盖了从数据分析基础知识、常见的统计学方法到使用ChatGPT进行数据准备、数据清洗、数据特征提取、数据可视化、回归分析与预测建模、分类与聚类分析,以及深度学习和大数据分析等全面的内容。
    朱宁计算机10.7万字
  • 会员
    近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang
    徐双双编著计算机12.7万字