Code Etc/후기 모음
-
[SK AI 경연] 참가 후기Code Etc/후기 모음 2023. 8. 5. 07:28
오늘 오후6시면 결과물 제출이 마감된다. 나는 내가 알고 있는, 할 수 있는 것을 최대한 많이 시도해봤기 때문에 미련은 없다.. 다만 상위권 순위에 있는 사람들이 어떻게 문제를 해결했는지가 너무 궁금하다 나중에 발표같은 게 있으면 꼭 찾아봐야겠다! 경연을 준비하면서 스스로 노력했던 포인트들을 몇 가지 적어보려고 한다. 총정리 느낌으로 쭈욱 보면 좋을 것 같다. 이번 경연의 주제는 앞서 말했다시피 "청각장애인을 위한 소리 분류 모델 개발"이다. 우리가 실생활에서 겪을 수 있는 사고를 유발하는 소리나 생활, 도시 소음 등을 분류하는 모델이다. 나는 경연에 참가하기 전에 사전조사로 구글링을 해봤는데 대부분 인공신경망을 통해 소리의 특성을 2차원으로 추출하여 이를 학습하는 글이었다. 그래서 나도 별생각없이 이렇..
-
[SK AI 경연] mfcc, mel 적용,,Code Etc/후기 모음 2023. 7. 30. 01:49
그간 공부한 내용을 바탕으로 소리 데이터를 mfcc와 mel spectogram을 활용해서 특성을 추출했고 이를 numpy를 통해 합쳤다. 학습 데이터를 살펴보니 스테레오 타입과 모노 타입이 존재해서 librosa로 load할 때 특성 추출에 효과적인 모노타입으로 변경해주었다. 그리고 과적합을 방지하기 위해 노이즈도 추가해주었다. 결과적으로 293개의 shape이 추출되었고 extratreeclassifier로 학습했는데 어큐러시와 로그손실이 전부 저조하게 나왔다..XGBoost도 써보려고 했으나 특성 추출에 오늘 사용 가능한 GPU를 전부 써버려서 내일 해봐야 할 것 같다.. 소리 분류와 관련된 많은 것들을 찾아보면 mfcc와 mel spectogram으로 80%이상의 높은 정확도를 가진 모델을 얻은 ..
-
[SK AI경연] MFCC, mel_spectrogram에 관하여Code Etc/후기 모음 2023. 7. 24. 22:19
MFCC란? MFCC (Mel-Frequency Cepstral Coefficient)로 소리 데이터를 특정벡터화 해주는 알고리즘이다. 머신러닝에서 어떤 데이터를 벡터화 한다는 것은 학습이 가능함을 의미한다. MFCC가 Feature로 사용될 수 있다는 뜻이고 librosa로 간단하게 추출할 수 있다. 그러나 파라미터에 따라 큰 차이를 보이므로 정확한 이해가 필요하다. SAMPLE_RATE는 음성 데이터의 형식에 따라 다를 수 있으므로 사용하는 데이터의 sampleRate를 아는 것이 중요하다. melscale mel은 사람 달팽이관을 모티브로 따온 개념이다. 사람은 저주파 소리변화는 잘 감지하는 데 고주파에서 변하는 소리는 잘 감지하지 못한다 이는 달팽이관의 구조와 관련이 있으며 이러한 특징은 우리가 ..
-
[SK AI경연] 소리 분류 모델 만들기Code Etc/후기 모음 2023. 7. 24. 21:34
현재 제 3회 SK AI 경연 CDS리그에 참가하고 있는데 꽤나 고전중이다.. 학습 데이터도 40GB에다가 테스트 데이터도 20GB정도 된다.. 내가 참가한 주제는 자연 소리 분류 분야인데 이와 관련된 것을 한 번도 접해본 적이 없다.. 근데 베이스라인 코드가 꽤 친절해서 모델 선정까지 다 해주는데 내가 할 수 있는거라곤 데이터 전처리, 불균형 처리, 파라미터 설정, 특성추출 등인데 전처리 하는 단계에서 런타임이 자꾸 꺼져서 이 방법은 시도하지 못했다.. 그리고 불균형 처리는 모델학습 할 때 가중치를 balanced로 설정하는 방법으로 조율했는데 그닥 효과적이지 못한 방법인 것 같다.. 이래 저래 어려움을 겪다가 소리 분류 모델이므로 소리 길이를 베이스라인 코드에서는 전부 사용했는데 나는 10초로 제한했..