전체 글(39)
-
[논문리뷰] 1. MV-DUSt3R+: Single-Stage Scene Reconstructionfrom Sparse Views In 2 Seconds
1️⃣ 기존 문제 (DUSt3R & MASt3R의 한계)✅ 카메라 캘리브레이션이나 포즈 추정 없이 재구성하는 방식은 이미 DUSt3R, MASt3R에서 했음.✅ 그런데 한 번에 딱 두 개의 뷰(pair)만 처리하는 구조라, 뷰가 많아지면 문제가 심각해짐.뷰가 많아질수록 쌍(pair) 조합 수가 기하급수적으로 증가.뷰 쌍끼리 정렬할 때 생긴 오류들이 누적됨.그래서 나중에 Global Optimization (GO)라는 비싼 정합 과정이 필요.근데 이 GO가 에러를 완벽하게 잡아내지 못함.(뷰 쌍끼리 붙이는 거라, 전체적으로 일관된 정렬 유지가 어려움)2️⃣ 이 논문에서 제안하는 해결책✅ MV-DUSt3R:한 번에 여러 뷰를 동시에 처리할 수 있는 Single-Stage Feed-Forward 네트워크.핵심..
2025.03.04 -
대구 북구 쓰레기 처리 및 재활용 하는 법!
요새 개강을 앞두고 자취하는 학생들이 늘어났어요!지역마다 다르지만 대구는 따로 쓰레기 업체를 두지 않고개인이 관리하도록 되어있더라구요. 잘못된 쓰레기 처리는 100만원 미만의 과태료를 부과해야해서 학생들에겐 아주 부담스러운 금액이에요! 특히 배달음식은 음식물이 묻어서 더 분류하기 힘들거에요~ 대구 북구 쓰레기 분류는 다음과 같이 이루어져요 주로 그날 새벽 6시에서 오후 3시까지 쓰레기 수거해 가시더라구요그래서 전날 오후 8시에서 오전 2시 사이에 쓰레기를 내놔야해요. 일반쓰레기는 일요일을 제외한 모든 날 수거하시고투명 페트병과 비닐류는 수요일 or 목요일에 수거하세요구역을 잘 확인해서 배출하시면 될거 같아요. 무조건 재활용이 가능한건 또 아니기에 확인해보시고 재활용되는 것만 내놓으시고 그 외는 ..
2025.03.02 -
[논문정리] 3. DUSt3R: Geometric 3D Vision Made Easy
3.2. Training Objective (학습 목표) 정리이 논문에서는 3D 공간에서의 회귀(regression) 기반 손실(loss) 을 사용하여 네트워크를 학습합니다.핵심 목표:✅ 3D 위치를 예측하는 회귀 손실 사용✅ 스케일 차이를 보정(scale normalization)✅ 신뢰도(Confidence)를 고려하여 가중치를 부여한 학습 진행🔹 1. 3D 회귀 손실 (3D Regression Loss)네트워크가 예측한 3D 포인트맵을 정답(Ground Truth)과 비교하여 학습하는 방식픽셀 i 에 대한 손실(loss)은 단순히 유클리드 거리(Euclidean Distance) 로 정의됨.→ 스케일 차이(Scale Ambiguity) 문제 해결예측한 포인트맵과 실제 포인트맵이 크기가 다를 수 있..
2025.02.27 -
[논문정리] 2. DUSt3R: Geometric 3D Vision Made Easy
[그림, 표 정리]아래 그림은 DUSt3R가 두 장의 이미지로부터 3D 정보를 회귀(regression)하는 과정을 한눈에 보여줍니다.핵심 아이디어는 포인트맵(pointmap)과 신뢰도(confidence)를 예측해, 두 이미지 각각의 픽셀을 공통 좌표계(camera1)에서 표현하는 것입니다. 1. 입력 (Image 1, Image 2)왼쪽에 두 장의 이미지가 들어옵니다.예시로, 빨간·초록·파랑(RGB) 채널을 patchify(패치화)하여 입력 준비.2. ViT(비전 트랜스포머) 인코더두 이미지 모두 동일한 ViT 인코더 가중치(shared weights)를 사용하여 토큰(token) 시퀀스로 변환.즉, Siamese 구조처럼, 각각의 이미지를 같은 네트워크가 처리하되, 가중치를 공유.3. Transfo..
2025.02.27 -
[논문정리] 1. DUSt3R: Geometric 3D Vision Made Easy
DUSt3R: 기하학적 3D 비전의 간편한 적용주어진 제약 없는 이미지 모음(즉, 카메라 자세 및 내부 매개변수가 알려지지 않은 사진 세트)을 입력으로 사용하면, 제안된 DUSt3R 방법은 상응하는 포인트맵(촘촘한 2D→3D 매핑)을 출력합니다.이를 통해 한 번에 추정하기 어려운 다양한 기하학적 요소를 쉽게 복원할 수 있습니다.복원 가능한 기하학적 요소카메라 보정(Camera calibration): 초점거리, 회전행렬, 이동벡터 등등깊이 추정(Depth estimation)픽셀 간 대응(Pixel correspondences): 서로 다른 이미지에서 같은 3D 점을 나타내는 픽셀을 찾아 연결하는 과정카메라 자세 추정(Camera pose estimation)밀집 3D 재구성(Dense 3D recons..
2025.02.23 -
논문 읽는 법 with 챗GPT
논문 읽으면서 논문 어케 읽는게 좋은거지 하면서 찾아봄 근데 gpt쨩이 정리왕이심 그래서 공유해봄 📌 논문 읽는 최적의 순서1️⃣ 제목 (Title) & 초록 (Abstract) 먼저 읽기🔹 목적: 논문의 핵심 주제와 연구 목표를 빠르게 이해하기 위함🔹 초점:연구가 어떤 문제를 해결하려고 하는지어떤 방법을 사용했는지어떤 성과를 거뒀는지✅ 예제 "딥러닝 기반 머신 비전용 비디오 압축 연구" → 머신 비전 영상 압축과 관련된 논문이구나!""제안된 방법이 BD-Rate를 최대 19.51% 개선했다" → 기존 압축 코덱보다 더 효율적인 기술을 연구했구나!"📌 이 단계에서 논문의 주제와 연구 가치가 내 관심사와 맞는지 판단.📌 이해가 안 되더라도 넘어가고, 전체적인 방향만 잡으면 됨.2️⃣ 결론 (Con..
2025.02.12