Skip to content

数据收集

由于大模型训练需要海量数据,故向大家征集Vcn相关知识训练数据,对于贡献突出者将送出惊喜大礼包。贡献方式:将数据集发给杰迅,审核通过后将记录贡献数据。

数据集格式:json文件格式,字段包含:input、thought、output,以下是一个例子:

json
[
  {
    "input": "这是用户问题",
    "thought": "这是思考过程,如:嗯...用户问我xxx,我需要回忆xxx的xxx...",
    "output": "这是答案输出"
  }
]

以下是突出贡献者列表:

Released by Jestion.