Skip to content

✍️ Add(post): SmolVLA#123

Merged
eehyo merged 3 commits intomainfrom
smolvla
Jan 5, 2026
Merged

✍️ Add(post): SmolVLA#123
eehyo merged 3 commits intomainfrom
smolvla

Conversation

@eehyo
Copy link
Collaborator

@eehyo eehyo commented Dec 23, 2025

신규 포스팅 작성 : SmolVLA: Efficient Vision-Language-Action Model trained on Lerobot Community Data
블로그 원문 : https://huggingface.co/blog/smolvla

@eehyo eehyo changed the title Smolvla ✍️ Add(post): SmolVLA Dec 23, 2025
Copy link
Collaborator

@hyeonseo2 hyeonseo2 left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

좋은 번역 감사합니다! 발표 때 실습해주셔서 내용을 쉽게 이해할 수 있었습니다.
영문 병기와 번역이 잘 되어 있어서, 아래 리뷰를 하나 남겼습니다!

Copy link
Collaborator

@ahnjj ahnjj left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

좋은 주제와 글 번역해주셔서 감사합니다 :)

**SmolVLA-450M**은 우리가 공개하는 오픈소스 VLA 모델로, 작지만 충분히 강력한 성능을 갖추고 있습니다. 주요 특징은 다음과 같습니다.
- CPU에서도 실행 가능하고, 소비자용 단일 GPU에서 학습할 수 있으며, 심지어 MacBook에서도 구동할 수 있을 만큼 작습니다!
- 공개된 커뮤니티 공유 로보틱스 데이터로 학습되었습니다.
- 전체 학습 및 추론 레시피를 함께 공개합니다.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
- 전체 학습 및 추론 레시피를 함께 공개합니다.
- 전체 학습 및 추론 레시피도 함께 공개합니다.


SmolVLA는 대형 언어 모델(LLM)의 학습 패러다임에서 영감을 받아, 일반적인 조작(manipulation) 데이터에 대한 사전학습을 거친 뒤 과제별(post-training) 후속 학습을 수행합니다. 아키텍처 측면에서는 Transformer와 flow-matching 디코더를 결합했으며, 다음과 같은 설계 선택을 통해 속도와 저지연 추론에 최적화했습니다.

* 더 빠른 추론과 더 작은 모델 크기를 위해 비전 모델 레이어의 절반을 생략
Copy link
Collaborator

@ahnjj ahnjj Jan 4, 2026

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
* 더 빠른 추론과 더 작은 모델 크기를 위해 비전 모델 레이어의 절반을 생략
* 비전 모델 레이어의 절반을 생략해서 추론 속도를 높이고 모델 크기를 감소

앞뒤를 바꿔보았어요! 더 자연스러운 표현을 택하시면 좋을 듯 합니다 :)


### Standardizing Camera Views

또 다른 과제는 카메라 이름이 일관되지 않다는 점이었습니다. 일부 데이터셋은 top이나 `wrist.right`처럼 명확한 이름을 사용한 반면, `images.laptop`과 같이 의미가 상황에 따라 달라질 수 있는 모호한 라벨을 사용하는 경우도 있었습니다.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
또 다른 과제는 카메라 이름이 일관되지 않다는 점이었습니다. 일부 데이터셋은 top이나 `wrist.right`처럼 명확한 이름을 사용한 반면, `images.laptop`과 같이 의미가 상황에 따라 달라질 수 있는 모호한 라벨을 사용하는 경우도 있었습니다.
또 다른 과제는 카메라 이름이 일관되지 않다는 것입니다. 일부 데이터셋은 top이나 `wrist.right`처럼 명확한 이름을 사용한 반면, `images.laptop`과 같이 의미가 상황에 따라 달라질 수 있는 모호한 라벨을 사용하는 경우도 있었습니다.

@eehyo eehyo merged commit c3f0da5 into main Jan 5, 2026
@eehyo eehyo deleted the smolvla branch January 5, 2026 03:41
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants