고려대학교 MLV Lab (머신러닝 및 비전 연구실) 에서 2023년 1월부터 학부 인턴으로 활동하고 있습니다.
각 주제에 관한 논문들을 함께 읽고 발표하는 스터디 활동을 진행하였습니다.
Graph Neural Network (GNN)
Artificial General Intelligence (AGI)
SegGPT 논문 발표
Segment Anything 논문 발표
Diffusion
https://github.com/stop1one/GANG-VQA
깃헙에 코드 및 보고서 pdf를 첨부하였습니다.
기초컴퓨터비전이론및응용(DATA302) 전공 수업에서 진행한 팀 프로젝트입니다. 기존의 VQA Task 모델인 GraphVQA 모델을 개선시켜 더 높은 성능을 기록했습니다.
Visual Question Answering (VQA)은 시각적 이미지와 텍스트 기반 질문을 입력으로 받아들이고, 해당 이미지와 질문에 대한 답변을 고르는 Multi-modal Task입니다.
기존의 GraphVQA라는 논문의 모델을 baseline 모델로 정하였습니다.
Pytorch와 Colab을 사용하였습니다.