Project Name

Multi-Modal Model Python Project

Overview

This project is a multi-modal model that accepts audio, images, and text as inputs, generating corresponding audio, images, and text outputs.

Features

Streamlit Interface : Coming Soon
Input Modalities: Audio, Images, Text, videos , emojis, multi inputs
Output Modalities: Audio, Images, Text, Videos , emojis , segmented images, images objects detection coordinates, multi outputs

Getting Started

Prerequisites

Python 3.x
Dependencies listed in requirements.txt

Installation

git clone https://github.com/Kind-Unes/Multi-Model-V1.git
cd 'MultiMODEL Template'
pip install -r requirements.txt

Usage

python model.py

Credits

TXT2IMG Models

Name		Name	Last commit message	Last commit date
Latest commit History 62 Commits
__pycache__		__pycache__
assets/images		assets/images
younes		younes
.gitignore		.gitignore
README.md		README.md
config.py		config.py
fastapi_server.py		fastapi_server.py
flask_server.py		flask_server.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Project Name

Overview

Features

Getting Started

Prerequisites

Installation

Usage

Credits

TXT2IMG Models

Text Generation Model

IMG2TXT Model

TTS Model

STT Model

Others . . . . .

Websites

About

Releases

Packages

Languages

Kind-Unes/MultiModal-Model

Folders and files

Latest commit

History

Repository files navigation

Project Name

Overview

Features

Getting Started

Prerequisites

Installation

Usage

Credits

TXT2IMG Models

Text Generation Model

IMG2TXT Model

TTS Model

STT Model

Others . . . . .

Websites

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages