1.15 연구일지

연구일지

김다응 2023. 1. 16. 14:02

728x90

- music vae 논문 세미나 (다음주에 전체 코드와 함께 세밀하게 리뷰)

vae 는 기본적으로 이미지에서 사용하던 task

sequence 데이터 continuous 한 데이터에 적용하기엔 문제가 있었음

-> posterior collapse problem

이 문제를 해결하기 위해 encoder decoder 단에 lstm 의 사용 등의 아이디어를 생각하였지만

music vae 에서는 decoder 단에서 latent vector 의 범위를 제한 시켜 conductor 라는 하나의 계층을 추가하고

conductor 는 임베딩 벡터를 생성하게 됨

디코더는 자기 회귀적으로 분포를 생성

논문 이해 전에 vae 기본 구현과 cvae, b-vae 의 이해가 필요하겠다는 생각을 하였음

riffusion/riffusion-model-v1 · Hugging Face

This model can be loaded on the Inference API on-demand.

huggingface.co

facebook/hubert-base-ls960 at main

Detected Pickle imports (3) "collections.OrderedDict", "torch._utils._rebuild_tensor_v2", "torch.FloatStorage" What is a pickle import?

huggingface.co

- today

audio lm pytorch

안됬던 이유 에러, 방법 정리

mu-bert 관련

1. music vae

2. music diffusion

3. audio lm

4. commu

5. diffusion 관련해서 돌려보라 하신거

오늘까지 audio lm 정리

참치 사주는 개발자

루루야 참치 사줄께

sort, 자료구조 #c언어 #그래프, 자료구조, 탐욕적알고리즘, prim, C언어, greedyAlgorithm, 음성합성 #코드리뷰 #Tacotron,

참치 사주는 개발자