large-vision-models

Here are 7 public repositories matching this topic...

Paranioar / Awesome_Matching_Pretraining_Transfering

The Paper List of Large Multi-Modality Model (Perception, Generation, Unification), Parameter-Efficient Finetuning, Vision-Language Pretraining, Conventional Image-Text Matching for Preliminary Insight.

Updated Sep 25, 2025

Ruiyang-061X / Awesome-MLLM-Uncertainty

Star

✨A curated list of papers on the uncertainty in multi-modal large language model (MLLM).

uncertainty uncertainty-quantification multi-modal uncertainty-estimation large-language-models mllm large-vision-language-models large-vision-models

Updated Apr 2, 2025

D2I-Group / awesome-vision-time-series

Star

This is an official repository for "Harnessing Vision Models for Time Series Analysis: A Survey".

time-series vision-models large-multimodal-models vision-language-models large-vision-models

Updated Aug 11, 2025
Python

BioRAILab / Neural-Brain-for-Embodied-Agents

Star

Project Page for Paper "Neural Brain: A Neuroscience-inspired Framework for Embodied Agents".

robotics neuroscience embodied embodied-agent embodied-ai large-language-models large-vision-models neural-brain

Updated Jun 5, 2025

PKU-Alignment / safe-sora

Star

SafeSora is a human preference dataset designed to support safety alignment research in the text-to-video generation field, aiming to enhance the helpfulness and harmlessness of Large Vision Models (LVMs).

alignment human-preferences text-to-video-generation large-vision-models