上海华讯网络系统有限公司、中电科数字科技(集团)有限公司申请一项名为“大语言模型分阶段预训练方法及系统”的专利-期货怎么做空邦度学问产权局讯息显示,上海华讯搜集体例有限公司、中电科数字科技(集团)有限公司申请一项名为“大措辞模子分阶段预操练伎俩及体例”的专利,公然号CN121072639A,申请日期为2025年8月。专利摘要显示,本发现供应了一种大措辞模子分阶段预操练伎俩及体例,囊括操纵根底数据集操练Transformer模子,优化负对数似然方向,采用AdamW优化器和余弦衰减练习率;基于第一阶段参数,操纵通用学问数据集连续操练;采用过采样战略加权操练周围专业数据。通过组织化操练方向和数据类型,模子能分阶段高效练习措辞根底、通用学问和专业才能。实习评释,该伎俩使模子正在根底阶段操练成果擢升40%,整个操练岁月缩短30%,同时正在专业周围做事上的切确率比古代端到端操练高15%~20%。最终模子参数通过专业才华评估,兼具通用措辞意会和周围拿手。
(注:公司简称遴选华讯搜集是基于上海华讯搜集体例有限公司的合理简称,若有其他央浼可调解;功效遴选“根底阶段操练成果擢升40%”契合模板央浼的简单功效输出。)
华讯搜集申请大措辞模子分阶段预操练伎俩及体例专利,使模子正在根底阶段操练成果擢升40%
邦度学问产权局讯息显示,上海华讯搜集体例有限公司、中电科数字科技(集团)有限公司申请一项名为“大措辞模子分阶段预操练伎俩及体例”的专利,公然号CN121072639A,申请日期为2025年8月。专利摘要显示,本发现供应了一种大措辞模子分阶段预操练伎俩及体例,囊括操纵根底数据集操练Transformer模子,优化负对数似然方向,采用AdamW优化器和余弦衰减练习率;基于第一阶段参数,操纵通用学问数据集连续操练;采用过采样战略加权操练周围专业数据。通过组织化操练方向和数据类型,模子能分阶段高效练习措辞根底、通用学问和专业才能。实习评释,该伎俩使模子正在根底阶段操练成果擢升40%,整个操练岁月缩短30%,同时正在专业周围做事上的切确率比古代端到端操练高15%~20%。最终模子参数通过专业才华评估,兼具通用措辞意会和周围拿手。
天眼查材料显示,上海华讯搜集体例有限公司,树立于2000年,位于上海市,是一家以从事软件和讯息手艺办事业为主的企业。企业注册资金12000万百姓币。通过天眼查大数据理会,上海华讯搜集体例有限公司共对外投资了4家企业,介入招投标项目5000次,物业线条,别的企业还具有行政许可13个。
中电科数字科技(集团)有限公司,树立于2012年,位于上海市,是一家以从事软件和讯息手艺办事业为主的企业。企业注册资金150000万百姓币。通过天眼查大数据理会,中电科数字科技(集团)有限公司共对外投资了9家企业,介入招投标项目19次,物业线条,别的企业还具有行政许可1个。
声明:商场有危急,投资需严谨。本文为AI基于第三方数据天生,仅供参考,不组成个体投资创议。
