Sha256: 8b415dd150c50f00668d5ca441392cd5070935e18d726dccc9b165248d586626
Contents?: true
Size: 1.41 KB
Versions: 2
Compression:
Stored size: 1.41 KB
Contents
# Kaba 咔吧是一款数据构建工具,使用 Ruby 完成,使用 typechat 作为核心,目的是构建一款能够比较好适配大模型 sft 数据集的工具,整个项目使用起来只需要安装 docker 即可。 > 开源协议:你爱干嘛干嘛 ## 安装 如果你有一个 Ruby 环境可用(且 ruby 版本大于 3.3),你可以使用以下命令全局安装 kaba: ``` gem install kaba ``` 否则,你可以通过别名运行一个 docker 化版本(将下面的命令添加到你的~/.bashrc、~/.zshrc或类似文件中,以简化重复使用)。 ``` alias kaba='docker run -it --rm -v "${PWD}:/workdir" ghcr.io/mjason/kaba:latest' ``` ## 目录结构说明 你的项目目录必须有 data 目录 - data - row - *.target.json - *.input.txt - schema - *.ts `*`代表文件名,随你喜欢,一般推荐用数字即可,schema 怎么定义直接看 typechat 文档就好了。 ## 关联项目 - [lisa_typechat_server](https://github.com/mjason/lisa_typechat_server) 如果要修改服务地址你有两个方式,一个通过 `.env` 来处理,还有就是自己设置环境变量,变量名 `LISA_TYPECHAT_ENDPOINT` ## changelog .env 需要更新 ``` ; LISA_TYPECHAT_ENDPOINT=https://lisa-typechat.listenai.com LISA_ACCESS_TOKEN=聆思平台的KEY JUDGE_ACCCESS_TOKEN=可以和LISA_ACCESS_TOKEN JUDGE_LLM_URI_BASE=如果需要其他提供商可以填,默认不填 ```
Version data entries
2 entries across 2 versions & 1 rubygems
Version | Path |
---|---|
kaba-0.5.0 | README.md |
kaba-0.4.0 | README.md |