首页技术区最新随笔(rss) RSS

共2页: 上一页 1 2 更多 

微调训练的数据集

使用trl库做微调时, 对数据集的要求是:

如果是多轮对话场景:
jsonl 文件,且需符合以下要求:
1.每行是一个独立的 JSON 对象;
2 每个对象须包含一个键名为 messages 的数组,数组不能为空;
3.messages 中每个元素必须包含 role 和 content 两个字段:
4.role 只能是 system,user 或 assisiant;
5.如果有 system 角色消息, 需在数组首位;
6.第一条非 system 消息必须是 user 角色;
7.user 和 assisiant 角色的消息应当交替、成对出现,不少于1对;

如果是指令微调场景:
jsonl 文件,且需符合以下要求:
1.每行是一个独立的 JSON 对象;
2 每个对象须包含且只能包含一个键名为 text 的键值对,值不能为空;

2025-03-21 21:52 作者: paulwong【评论:0】【阅读:82】 

零基础IM开发入门(五):什么是IM系统的端到端加密?

     摘要: 本文由夏冰软件cc分享,下文进行了排版和内容优化。1、引言本文接上篇《什么是IM系统的消息时序一致性?》,本篇将通俗易懂地讲解IM系统中的端到端加密原理,为了降低阅读门槛,相关的技术概念会提及但不深入展开。IM即时通讯系统的技术本质是“即时消息技术”,是互联网实时互动场景的底层架构,包括聊天、直播、在线客服等业务领域在内,所有需要实时互动、高实时性的场景,都需要用到IM技术...  阅读全文

2025-03-20 11:11 作者: Jack Jiang【评论:0】【阅读:68】 

共2页: 上一页 1 2 更多 

技 术 改 变 世 界

宣传语

网站分类

其他分类

Google站内搜索

 

24小时内最热随笔

统计信息

订阅

Blog客户端API

推荐客户端

博客排行榜[前100人]