Dangsun

이번 회차 흐름

안녕하세요! 오늘은 사진·이미지에서 3D를 뽑아내는 모델 흐름이 유난히 두드러진 날입니다. Tencent의 Hunyuan3D와 Microsoft TRELLIS 2.0이 동시에 업데이트되면서 단일 이미지로도 매시(3D 형상)를 만들어내는 품질이 한 단계 올라왔어요. NVIDIA는 VGGT 후속과 dvlt 같은 경량 모델로 멀티뷰 재구성 쪽을 정리했고, 건축 도구 쪽에서는 FreeCAD와 pyRevit이 꾸준한 커밋으로 살아있음을 보여줬습니다. arXiv에는 사진 촬영 단계를 3D 씬에서 사전 계획하는 'Before the Shutter'처럼 건축 공간 인지와 닿아 있는 연구가 코드와 함께 올라왔습니다. 컨셉 단계의 매시업과 발주처 프레젠테이션 모두에 끼워 넣을 거리가 많은 주말입니다.

오늘의 헤드라인

01 Tencent Hunyuan3D-2.1 — 단일 이미지로 고해상도 3D 매시 생성 ↗ GitHub9/10

사진 한 장을 넣으면 텍스처가 입혀진 3D 매시를 자동으로 뽑아주는 오픈소스 모델입니다. 기존에 SketchUp이나 Rhino에서 손으로 박스를 쌓아 만들던 매스를 AI가 대신 만들어주는 셈이에요. HuggingFace에서 가중치가 공개돼 있고 GitHub에서 코드와 사용법이 다 정리돼 있습니다. image-to-3d 분야의 대표 저장소 중 하나로 자리 잡았습니다.

단일 이미지 → 3D 매시 + 텍스처를 한 번에 출력
가중치 공개, 로컬에서 GPU만 있으면 실행 가능
Blender·Rhino로 바로 가져갈 수 있는 OBJ/GLB 포맷 지원

얻는 것

현상설계 컨셉 단계에서 손스케치나 레퍼런스 사진을 넣어 매스 매시를 빠르게 뽑아 검토 모델로 쓸 수 있습니다. 정밀하진 않아도 발주처에 보여줄 컨셉 매스로는 충분합니다.

지금 할 일

git clone https://github.com/Tencent-Hunyuan/Hunyuan3D-2 후 README의 inference 예제로 레퍼런스 사진 한 장을 매시로 변환해보세요.

왜 지금

image-to-3d 토픽 별점 1위 모델이 최근에도 활발히 정리되고 있어서, 지금이 익혀두기 좋은 시점입니다.

02 Microsoft TRELLIS 2.0 — 4B 파라미터로 키워진 이미지→3D 재구성 ↗ HuggingFace9/10

마이크로소프트가 이미지 한 장에서 3D 매시·가우시안 스플랫(점 구름으로 만든 사진 같은 3D)·NeRF까지 동시에 뽑는 TRELLIS의 2세대를 공개했습니다. 4B 파라미터로 덩치를 키워 디테일과 형상 일관성이 1세대보다 한 단계 더 좋아졌어요. HuggingFace 모델 카드에 사용법과 가중치가 정리돼 있고, GitHub의 microsoft/TRELLIS 저장소에서 코드도 받을 수 있습니다.

한 모델로 매시·스플랫·NeRF 동시 출력 — 용도에 맞춰 골라 씀
상용 라이센스 친화적 — 실무 도입 부담 적음
12.8k 별의 활성 저장소, 커뮤니티 튜토리얼 풍부

얻는 것

건물 입면 사진 한 장을 넣어 점 구름 형태의 3D를 만들면 현장 답사 결과를 바로 BIM 위에 겹쳐 볼 수 있습니다. 컨셉 단계와 현황 분석 단계 둘 다에 활용 가능합니다.

지금 할 일

git clone https://github.com/microsoft/TRELLIS 후 README의 image-to-3d 예제로 답사 사진 한 장을 스플랫으로 변환해보세요.

왜 지금

4B 버전이 안정화 단계에 들어서서 지금 도입해도 곧바로 손에 익습니다.

03 Tencent HunyuanWorld 2.0 — 한 장에서 도시·실내 통째 3D 씬 ↗ HuggingFace8/10

오브젝트 하나가 아니라 거리·실내·풍경 같은 3D 씬 전체를 이미지 한 장에서 만들어내는 모델입니다. 지금까지의 image-to-3d가 가구나 단일 매스 수준이었다면, 이건 도시 블록 단위까지 확장한 거예요. 모델 페이지에 사용 예제와 가중치가 정리돼 있습니다. arxiv 2604.14268 논문과 함께 공개됐고 worldmodel·3d 태그가 붙어 있습니다.

단일 이미지 → 도시·실내 씬 전체 3D 출력
HunyuanWorld-Mirror 등 동일 패밀리 모델로 확장 가능
Blender·Unity로 가져갈 수 있는 표준 포맷

얻는 것

현상 부지 항공사진 한 장으로 주변 컨텍스트 매시를 만들어 분석 모델로 쓸 수 있습니다. 위성 사진 → 주변 매스 스터디 작업이 크게 단축됩니다.

지금 할 일

HuggingFace 모델 페이지의 예제 코드를 받아 부지 항공사진 한 장으로 씬을 생성해보세요.

왜 지금

오브젝트 단위 → 씬 단위로 image-to-3d가 확장되는 변곡점이라 지금 흐름을 따라가두는 게 좋습니다.

04 NVIDIA VGG-TTT — 가벼운 멀티뷰 3D 재구성 ↗ HuggingFace8/10

NVIDIA가 메타 VGGT 후속으로 내놓은 멀티뷰 재구성 모델입니다. 사진 여러 장을 넣으면 카메라 위치(camera-pose)와 점 구름(pointmap)·깊이(depth-estimation)를 동시에 추정해 3D를 만듭니다. test-time training(ttt) 기법으로 정확도를 올린 게 특징이에요.

여러 사진 → 카메라 자세 + 3D 점 구름 동시 추정
1B로 가벼워 노트북 GPU에서도 시도 가능
답사 사진 묶음을 매시로 변환하는 표준 도구 후보

얻는 것

현장 답사 때 스마트폰으로 찍은 사진 묶음에서 곧장 3D를 뽑아 BIM과 비교할 수 있습니다. 측량팀에 의뢰하지 않고도 컨셉 단계 현황 모델을 만들 수 있어요.

지금 할 일

HuggingFace에서 nvidia/vgg-ttt 페이지의 예제로 답사 사진 5~10장을 넣어 점 구름을 뽑아보세요.

왜 지금

VGGT 계열은 멀티뷰 재구성의 표준이 되어가는 중이라, 이번 후속 공개가 적기입니다.

05 카메라·자세·조명을 3D 씬에서 미리 계획하는 'Before the Shutter' ↗ arXiv7/10

사진 찍기 전에 피사체 자세·카메라 위치·조명을 3D 씬 안에서 미리 계산해 최적 구도를 짜주는 연구입니다(원문은 인물 사진 기획이 주제). 건축 사진 촬영이나 BIM 모델에서 발주처에 보여줄 컷을 자동으로 골라내는 발상으로도 응용 가능해요. 'Aesthetic and Actionable' 표현대로 미적 평가와 실행 가능한 가이드를 동시에 제공한다는 게 핵심입니다. 코드 저장소가 공개돼 있습니다.

3D 씬 안에서 카메라·조명·피사체를 사전 계획
Photographic Scene Graph로 씬 어포던스 표현
건축 모델 렌더링 자동 구도 잡기에 응용 여지

얻는 것

BIM 모델 안에서 발주처 프레젠테이션용 베스트 컷을 자동 추천하는 도구로 발전시킬 수 있습니다. 직접 무관하지만 응용은 분명히 있어요.

지금 할 일

git clone https://github.com/songrise/Before-the-Shutter 후 README 따라가며 씬 표현 방식을 살펴보세요.

왜 지금

건축 시각화 자동화의 기초 연구라 일찍 봐두면 다음 도구가 나왔을 때 빠르게 적응할 수 있습니다.

핫 레포

06 FreeCAD — 오픈소스 파라메트릭 3D 모델러 ↗ GitHub7/10

FreeCAD는 오픈소스 파라메트릭 모델러로, Rhino나 Revit의 대안으로 자주 거론되는 도구입니다. BIM 워크벤치를 통해 IFC 입출력도 지원하고 있어요. 멀티플랫폼 공식 저장소로 활발히 유지보수되는 프로젝트입니다. C++ 기반이지만 Python 스크립트로 확장 가능합니다.

오픈소스이고 IFC 입출력 지원
Python 스크립트로 자동화 워크플로우 구축 가능
어제도 커밋 — 매우 활발

얻는 것

라이센스 부담 없이 BIM 자동화 파이프라인의 백엔드로 쓸 수 있습니다. Revit 라이센스 없이 클라이언트에게 IFC를 받아 처리하는 용도로도 유용해요.

지금 할 일

git clone https://github.com/FreeCAD/FreeCAD 또는 공식 빌드 설치 후 BIM 워크벤치를 켜고 IFC 파일을 열어보세요.

왜 지금

매일 커밋되는 살아있는 프로젝트로, 지금 도입해도 향후 5년은 안심하고 쓸 수 있습니다.

07 pyRevit — Revit 자동화 스크립트 환경 ↗ GitHub8/10

Revit 위에서 Python으로 자동화 스크립트와 도구를 만드는 RAD(Rapid Application Development) 환경입니다. 매스 모델링·시트 자동화·뷰 정리 같은 반복 작업을 한 줄짜리 명령으로 묶을 수 있어요. 공식 배포 저장소가 활발히 유지보수되고 있습니다. Revit 쓰는 사람이라면 이거 하나로 일이 반으로 줄어듭니다.

Revit 안에서 Python 스크립트로 자동화
반복 작업을 버튼 한 번에 묶기
Dynamo보다 가볍고 직관적

얻는 것

현상설계 막판 시트 정리·뷰 일괄 변경·매개변수 일괄 수정 같은 반복 작업을 한 번에 처리할 수 있습니다. Revit 사용자에게 즉시 도움이 됩니다.

지금 할 일

https://github.com/pyrevitlabs/pyRevit/releases 에서 인스톨러를 받아 Revit에 설치하세요.

왜 지금

Revit 2026 호환성 작업이 활발해 지금 시작하면 새 버전 출시 시 무리 없이 따라갑니다.

08 OpenProject — IFC·BCF 지원 오픈소스 프로젝트 관리 ↗ GitHub6/10

OpenProject는 오픈소스 프로젝트 관리 도구로, 칸반·간트 같은 일반 PM 기능을 제공합니다. 별도의 BIM 모듈로 IFC·BCF(BIM 협업 포맷 — 모델 위 코멘트 주고받는 표준)를 다루는 워크플로우도 지원되는 것으로 알려져 있습니다. Ruby 기반의 자체 호스팅 솔루션입니다.

IFC 뷰어 + BCF 이슈 관리 통합
칸반·간트·로드맵 같은 일반 PM 기능과 연결
자체 호스팅 가능 — 데이터 외부 유출 걱정 없음

얻는 것

여러 회사와 협업하는 현상·실시설계에서 BIM 이슈를 관리할 수 있는 자체 호스팅 솔루션입니다. Bentley·Autodesk 클라우드 의존 없이 운영 가능.

지금 할 일

Docker로 한 번 띄워보세요 — README에 docker-compose 예제 있습니다.

왜 지금

BCF 표준이 자리 잡으면서 협업 도구 선택지가 늘어나는 지금 후보를 비교해두면 유용합니다.

모델 · 데이터셋

09 TencentARC Pixal3D — 새 image-to-3D 모델 ↗ HuggingFace7/10

Tencent의 ARC 랩이 공개한 image-to-3d 모델로, 'Pixel-Aligned 3D Generation from Images'를 표방합니다. 모델 카드에 inference 예제와 가중치가 정리돼 있습니다. Hunyuan3D 계열과는 별개로 가벼운 시도를 해볼 수 있는 옵션이에요. MIT 라이센스라 활용 폭이 넓습니다.

가장 최근 공개된 image-to-3d 모델
TencentARC의 InstantMesh 후속 흐름
상대적으로 가벼운 모델일 가능성

얻는 것

Hunyuan3D보다 가벼운 매시 생성기로 활용할 수 있습니다. 옵션을 한 개 더 확보해두는 의미가 큽니다.

지금 할 일

HuggingFace 모델 페이지에서 예제 노트북을 받아 매시 생성을 테스트해보세요.

왜 지금

6일 전 갓 공개돼 비교 실험을 해두면 다음 작업에 어느 모델을 쓸지 빠르게 판단할 수 있습니다.

10 Stability AI Stable Fast 3D — 빠른 단일 이미지 3D ↗ HuggingFace7/10

Stability AI의 가벼운 image-to-3d 모델로, 이름대로 속도가 가장 큰 강점입니다. 단일 이미지에서 매시를 빠르게 생성하도록 설계됐어요. Stability AI 커뮤니티 라이센스가 적용된 검증된 모델입니다. Hunyuan3D가 무거울 때 대체재로 좋습니다.

단일 이미지 → 매시 수 초 내 출력
1B 파라미터로 가벼움 — 노트북 GPU에서도 OK
상용 라이센스 명확

얻는 것

발주처 미팅에서 즉석으로 사진을 매시로 만들어 보여주는 시연용으로 적합합니다. Hunyuan3D의 무게가 부담스러운 환경에 대안.

지금 할 일

HuggingFace 모델 카드의 inference 예제 그대로 실행해 속도를 확인해보세요.

왜 지금

무거운 모델들 대비 속도 우위가 명확해서 빠른 프로토타이핑 용도로 자리 잡고 있습니다.

11 Facebook VGGT-1B-Commercial — 상용 가능 멀티뷰 재구성 ↗ HuggingFace7/10

메타의 VGGT(여러 사진에서 카메라와 3D를 동시 추정) 1B 모델의 상용 라이센스 버전입니다. 사진 여러 장에서 카메라 자세와 점 구름을 한 번에 뽑습니다. 'vggt-aup-license'가 적용돼 상용 활용을 명시적으로 허용합니다. NVIDIA의 vgg-ttt 계열과 같은 VGGT 흐름의 원조 격.

사진 묶음 → 카메라·점 구름 동시 추정
상용 라이센스 — 외주 결과물에 사용 가능
멀티뷰 재구성의 표준 베이스라인

얻는 것

답사 사진에서 만든 3D 결과를 클라이언트에게 납품해도 라이센스 안전합니다. Hunyuan3D 같은 무거운 모델 없이도 충분.

지금 할 일

HuggingFace에서 모델 받아 답사 사진 5장으로 점 구름 추정을 돌려보세요.

왜 지금

라이센스 명확한 상용 버전이 나와 실무 도입 장벽이 사라진 시점입니다.

12 Apple Sharp — 단일 이미지 3D 재구성 ↗ HuggingFace6/10

애플의 image-to-3d 모델 'Sharp'입니다. apple-amlr 라이센스(연구 목적 위주)로 공개돼 있고 모델 카드에 사용 안내가 있어요. 안정적으로 받아 쓸 수 있는 모델로 자리잡아, 답사용 모바일 워크플로우와 연결할 가능성도 있어요.

애플 스택에서 동작 최적화
모바일 친화 경량 모델
사용 라이센스가 비교적 엄격 — 카드 확인 필수

얻는 것

아이폰으로 현장 사진을 찍어 즉시 매시를 만드는 답사 도구의 가능성을 보여줍니다. 직접 도입은 라이센스 검토 필요.

지금 할 일

HuggingFace 카드에서 라이센스 조항 먼저 확인 후 데모 코드 실행해보세요.

왜 지금

애플이 이 분야에 본격 참전한 신호라 앞으로 흐름이 어디로 갈지 가늠하는 데 도움됩니다.

13 Tencent HunyuanWorld-Mirror — 거울처럼 씬을 재구성 ↗ HuggingFace6/10

HunyuanWorld 패밀리의 변형으로, 이미지·비디오(image-to-3D·video-to-3D 태그) 입력에서 3D 씬을 재구성하는 모델입니다. arxiv 2510.10726과 함께 공개됐고 3d-reconstruction·scene-generation 태그가 붙어 있어요. HunyuanWorld 2.0과 같이 쓸 수 있는 보조 도구로 위치합니다.

1B 파라미터로 가벼운 씬 재구성
HY-World 패밀리 일부 — 같이 쓰면 시너지
검증된 다운로드 기록

얻는 것

HunyuanWorld 2.0이 너무 무거울 때의 가벼운 대안입니다. 부지 항공사진 단순 재구성에 적합.

지금 할 일

HuggingFace 카드의 inference 예제를 그대로 따라 해보세요.

왜 지금

HunyuanWorld 패밀리가 다양화되는 시점에 옵션을 비교해두면 다음 작업의 선택이 빨라집니다.

주목할 논문

14 FreeForm — 매시 없이 입자로 변형 시뮬레이션 ↗ arXiv6/10

매시(삼각형으로 쪼갠 표면)나 신경망 필드 없이 입자 기반으로 변형체 시뮬레이션을 하는 NVIDIA·토론토대 공동 연구('Reduced-Order Deformable Simulation from Particle-Based Skinning Eigenmodes')입니다. 메쉬가 없는(mesh-free) 형식이라 가우시안 스플랫 같은 점 표현에도 적용할 수 있다는 게 핵심입니다. 프로젝트 페이지에 코드 정보가 정리돼 있습니다.

매시 없이 입자로 변형 시뮬레이션
FEM 대비 학습 40배 빠름
가우시안 스플랫에도 적용 가능

얻는 것

현상설계 시각화에서 천막·텐서일·인테리어 페브릭의 거동을 매시 없이 시뮬레이션할 수 있게 됩니다. 실험적이지만 흐름은 알아둘 가치 있어요.

지금 할 일

https://research.nvidia.com/labs/sil/projects/freeform/ 에서 코드·데모를 확인해보세요.

왜 지금

매시 의존성을 깨려는 시도가 학회에서 본격 인정받기 시작한 시점입니다.

15 SuperVoxelGPT — 자기회귀 방식 3D 형상 생성 ↗ arXiv6/10

3D 형상을 슈퍼복셀(여러 작은 정육면체 묶음)로 토큰화해 자기회귀(autoregressive) 방식으로 순서대로 생성하는 연구입니다. 텍스트 생성하듯 형상을 한 토큰씩 뽑는 발상이에요. '적응적이고 순서가 매겨진(Adaptive and Ordered)' 토큰화로, 기존 set-기반/균일 복셀의 한계를 극복하려는 것이 핵심 기여입니다. cs.CV 카테고리의 새 논문입니다.

3D 형상을 슈퍼복셀 토큰 시퀀스로 변환
자기회귀(GPT 방식)로 형상 생성
'적응적'·'순서 있는' 토큰화

얻는 것

건축 매스를 텍스트처럼 토큰으로 다루는 패러다임은 향후 텍스트→매스 생성 도구의 기반이 됩니다. 직접 무관, 흐름 확인용.

지금 할 일

arXiv abstract를 훑어 토큰화 방식만 이해해두세요.

왜 지금

3D 생성에서 자기회귀가 다시 주목받는 시점으로 방향성을 알아둘 가치 있습니다.

개발 툴

16 McNeel rhino-developer-samples — Rhino·GH 개발 공식 샘플 ↗ GitHub7/10

라이노/그래스호퍼를 만든 McNeel이 공식 배포하는 개발 샘플 모음입니다. Rhino SDK·Grasshopper 컴포넌트 만드는 법 등 다양한 예제가 들어 있습니다. GH 컴포넌트를 직접 짤 일이 있다면 첫 참고서로 적합합니다.

Rhino·GH 공식 SDK 예제 모음
컴포넌트 개발·서버 호출 예제 다수
최신 Rhino 8 대응

얻는 것

건축 AI 도구를 GH 컴포넌트로 만드는 모든 작업의 출발점입니다. Hunyuan3D 같은 모델을 GH에서 호출하는 래퍼를 만들 때 직접 참고.

지금 할 일

git clone https://github.com/mcneel/rhino-developer-samples 후 README의 폴더 구조를 확인하고 관심 있는 예제부터 열어보세요.

왜 지금

외부 AI 모델을 GH에 연결하는 일이 늘어나는 흐름에서 공식 레퍼런스는 항상 손 닿는 곳에 있어야 합니다.

17 Assimp — 3D 포맷 변환 라이브러리 ↗ GitHub6/10

Assimp는 40여 가지 3D 포맷을 읽고 쓰는 C++ 라이브러리입니다(공식 설명: 'Loads 40+ 3D-file-formats into one unified and clean data structure'). OBJ·FBX·GLB 같은 포맷 간 변환을 자동화할 때 사실상 표준이에요. 파이썬 바인딩도 있어 자동화 스크립트에서도 그대로 호출됩니다.

40여 종 3D 포맷 읽기/쓰기
IFC·FBX·GLB·OBJ 변환 자동화
Python 바인딩 제공

얻는 것

클라이언트가 보낸 FBX를 GLB로 변환하는 자동화 스크립트의 기반으로 적합합니다. BIM 파이프라인 글루로 매우 유용.

지금 할 일

pip install pyassimp 후 FBX 한 개를 GLB로 변환하는 코드를 작성해보세요.

왜 지금

포맷 다양화가 가속되는 흐름에서 변환 표준 라이브러리는 시간이 갈수록 더 중요해집니다.

18 Astral3D — 웹 기반 3D 뷰어 프레임워크 ↗ GitHub6/10

Vue3 + Three.js 기반의 오픈소스 3D 엔진/에디터로, BIM 경량화(BIM lightweighting)·CAD 파싱 프리뷰·파티클·플러그인 시스템을 내장하고 있습니다. 즉 일반 3D 뷰어를 넘어 BIM 모델을 브라우저에서 보고 다룰 수 있게 만든 프레임워크예요. 발주처에 링크 하나로 모델을 띄워줄 수 있는 환경을 만들 수 있습니다.

Three.js 기반 웹 3D 뷰어/편집기
브라우저에서 모델 공유 — 설치 불필요
BIM 토픽에서 활용도 인정

얻는 것

발주처에 PDF 대신 링크 하나로 회전·확대·단면 가능한 모델을 보낼 수 있습니다. 디자인 리뷰 단계에서 의사소통 비용을 줄입니다.

지금 할 일

git clone https://github.com/mlt131220/Astral3D 후 README 따라 로컬에서 띄워보세요.

왜 지금

PPT보다 한 단계 위 인터랙티브 발표가 표준으로 자리 잡는 시점입니다.

맺음말

하나의 이미지에서 매시까지 한 번에 나오는 흐름이 이제 정착 단계예요. 곧 그래스호퍼 안에서 이런 모델을 직접 호출해 매시를 받아오는 워크플로우가 표준이 될 겁니다. 토요일이니 가볍게 모델 하나만 돌려보시는 걸 권합니다.