딥러닝) 딥러닝 개념 정리(7)

카테고리 없음

jijijinog 2025. 11. 14. 09:44

Generative AI

사용자의 요청(프롬프트)에 따라 텍스트, 이미지, 오디오, 비디오 등
새로운 콘텐츠를 생성할 수 있는 인공지능의 한 종류이다

Multimodal Generative AI

Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation

Diffusion 모델

노이즈를 점점 제거하면서 원하는 데이터를 만들어내는 생성 AI 방식이다.

Diffusion 기반 모델

정방향 확산(forward diffusion)
역방향 확산(reverse diffusion)

Cross-modal Fusion (영상과 오디오의 동시 학습)

서로 다른 종류의 데이터(예: 영상과 오디오)의 표현을 상호 학습하고 융합하는 방법론이다.

초보가 하는 코딩

안녕하세요

집, 챗지피티, c언어, 라즈베리파이, 코딩, 방학, 초보가 하는 코딩, 동아리, 과제, 딥러닝, AI, 코드업, 백준, LED, 아두이노, 파이썬, 2차원 배열, 코딩 초보, 머신러닝, 인공지능,

초보가 하는 코딩