Zeta-Tool - Easily create your own LLM

Tip

Now you can use a variety of popular models other than OpenAI's GPT2✨

Important

Main Repository: Zeta

Zeta-Tool - Easily create your own LLM

Fully Open-source LLM Tool

Select Pre-trained Model👐
Select Dataset🧠
Wait🕰️
Successfully Created Your Own LLM✨

How to use

Install

Install Git and Git-LFS
Clone This Repository (Example: git clone https://github.com/DiamondGotCat/Zeta-Tool.git)
Check and Install Python and PIP (Recommend: Miniconda)
Install Requiments using PIP (Example: pip install pandas transformers torch "transformers[torch]" rich datasets pip install --upgrade pandas transformers torch "transformers[torch]" rich datasets)

Training

Run training.py using Python
Answer Selection
Wait
Done

Test

Run execute.py using Python
If Loaded, then Enter Prompt
Get Answer
Enter /q to Exit Chat

Scripts

training.py: Learning using AzukiF 1.0 Dataset
execute.py: Run Learned Model (You Need Move Model Folder to ./trained-model)

Official Public Datasets

Zeta-LLM/Zeta-Dataset/releases

Selectable Base Models

OpenAI

gpt2
- Overview: Training from Scratch
- Tokenizer: openai-community/gpt2
gpt2-small
- Tokenizer/Model: openai-community/gpt2
gpt2-medium
- Tokenizer/Model: openai-community/gpt2-medium

Google

NOTE: Model Access Permission Required

gemma
- Size 2b:
  - Tokenizer/Model: google/gemma-2b
- Size 7b:
  - Tokenizer/Model: google/gemma-7b
codegemma
- Size 2b:
  - Tokenizer/Model: google/codegemma-2b
- Size 7b:
  - Tokenizer/Model: google/codegemma-7b
gemma1.1 (Inst)
- Size 2b:
  - Tokenizer/Model: google/gemma-1.1-2b-it
- Size 7b:
  - Tokenizer/Model: google/gemma-1.1-7b-it
gemma2
- Size 2b:
  - Tokenizer/Model: google/gemma-2-2b
- Size 9b:
  - Tokenizer/Model: google/gemma-2-9b
- Size 27b:
  - Tokenizer/Model: google/gemma-2-27b

Alibaba

qwen
- Size 1.8b:
  - Tokenizer/Model: Qwen/Qwen-1_8B
- Size 7b:
  - Tokenizer/Model: Qwen/Qwen-7B
- Size 14b:
  - Tokenizer/Model: Qwen/Qwen-14B
- Size 72b:
  - Tokenizer/Model: Qwen/Qwen-72B
qwen1.5
- Size 0.5b:
  - Tokenizer/Model: Qwen/Qwen1.5-0.5B
- Size 1.8b:
  - Tokenizer/Model: Qwen/Qwen1.5-1.8B
- Size 4b:
  - Tokenizer/Model: Qwen/Qwen1.5-4B
- Size 14b:
  - Tokenizer/Model: Qwen/Qwen1.5-14B
- Size 32b:
  - Tokenizer/Model: Qwen/Qwen1.5-32B
- Size 72b:
  - Tokenizer/Model: Qwen/Qwen1.5-72B

Local Model

from Safetensor Directory

Custom Model

from HuggingFace Repo

Thank you for reading this.

Actually, Zeta-Tool is a personal project. There are still parts that haven't been developed yet.

If possible, please help in one of the following ways:

Simple: Please give it a star.
For programmers/engineers: Help with code fixes or testing. (See Ideas)
For those who can support Zeta-Tool's future: Publish the trained models on HuggingFace. However, please include information about the Zeta-Tool project. For more details, see Help with Trained Model.

Name		Name	Last commit message	Last commit date
Latest commit History 108 Commits
Help		Help
.gitattributes		.gitattributes
Idea.md		Idea.md
LICENSE		LICENSE
README.md		README.md
build-dataset.py		build-dataset.py
convert-from-jsonl.py		convert-from-jsonl.py
execute.py		execute.py
training.py		training.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Zeta-Tool - Easily create your own LLM

How to use

Install

Training

Test

Scripts

Official Public Datasets

Selectable Base Models

OpenAI

Google

Meta

Alibaba

Local Model

Custom Model

About

Uh oh!

Contributors 2

Uh oh!

Languages

License

Zeta-DGC/Zeta-LLM-Tool

Folders and files

Latest commit

History

Repository files navigation

Zeta-Tool - Easily create your own LLM

How to use

Install

Training

Test

Scripts

Official Public Datasets

Selectable Base Models

OpenAI

Google

Meta

Alibaba

Local Model

Custom Model

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Contributors 2

Uh oh!

Languages