Conversation
hyeonseo2
requested changes
Dec 27, 2025
Collaborator
hyeonseo2
left a comment
There was a problem hiding this comment.
좋은 번역 감사합니다! 발표 때 실습해주셔서 내용을 쉽게 이해할 수 있었습니다.
영문 병기와 번역이 잘 되어 있어서, 아래 리뷰를 하나 남겼습니다!
ahnjj
approved these changes
Jan 4, 2026
| **SmolVLA-450M**은 우리가 공개하는 오픈소스 VLA 모델로, 작지만 충분히 강력한 성능을 갖추고 있습니다. 주요 특징은 다음과 같습니다. | ||
| - CPU에서도 실행 가능하고, 소비자용 단일 GPU에서 학습할 수 있으며, 심지어 MacBook에서도 구동할 수 있을 만큼 작습니다! | ||
| - 공개된 커뮤니티 공유 로보틱스 데이터로 학습되었습니다. | ||
| - 전체 학습 및 추론 레시피를 함께 공개합니다. |
Collaborator
There was a problem hiding this comment.
Suggested change
| - 전체 학습 및 추론 레시피를 함께 공개합니다. | |
| - 전체 학습 및 추론 레시피도 함께 공개합니다. |
|
|
||
| SmolVLA는 대형 언어 모델(LLM)의 학습 패러다임에서 영감을 받아, 일반적인 조작(manipulation) 데이터에 대한 사전학습을 거친 뒤 과제별(post-training) 후속 학습을 수행합니다. 아키텍처 측면에서는 Transformer와 flow-matching 디코더를 결합했으며, 다음과 같은 설계 선택을 통해 속도와 저지연 추론에 최적화했습니다. | ||
|
|
||
| * 더 빠른 추론과 더 작은 모델 크기를 위해 비전 모델 레이어의 절반을 생략 |
Collaborator
There was a problem hiding this comment.
Suggested change
| * 더 빠른 추론과 더 작은 모델 크기를 위해 비전 모델 레이어의 절반을 생략 | |
| * 비전 모델 레이어의 절반을 생략해서 추론 속도를 높이고 모델 크기를 감소 |
앞뒤를 바꿔보았어요! 더 자연스러운 표현을 택하시면 좋을 듯 합니다 :)
|
|
||
| ### Standardizing Camera Views | ||
|
|
||
| 또 다른 과제는 카메라 이름이 일관되지 않다는 점이었습니다. 일부 데이터셋은 top이나 `wrist.right`처럼 명확한 이름을 사용한 반면, `images.laptop`과 같이 의미가 상황에 따라 달라질 수 있는 모호한 라벨을 사용하는 경우도 있었습니다. |
Collaborator
There was a problem hiding this comment.
Suggested change
| 또 다른 과제는 카메라 이름이 일관되지 않다는 점이었습니다. 일부 데이터셋은 top이나 `wrist.right`처럼 명확한 이름을 사용한 반면, `images.laptop`과 같이 의미가 상황에 따라 달라질 수 있는 모호한 라벨을 사용하는 경우도 있었습니다. | |
| 또 다른 과제는 카메라 이름이 일관되지 않다는 것입니다. 일부 데이터셋은 top이나 `wrist.right`처럼 명확한 이름을 사용한 반면, `images.laptop`과 같이 의미가 상황에 따라 달라질 수 있는 모호한 라벨을 사용하는 경우도 있었습니다. |
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
신규 포스팅 작성 : SmolVLA: Efficient Vision-Language-Action Model trained on Lerobot Community Data
블로그 원문 : https://huggingface.co/blog/smolvla