mobile background

음악 산업혁명 : 음원도 이젠 '한계비용 제로'

2024-04-16

🎯이것만은 꼭!

  • 🏇‘인텔 vs 구글 vs 메타’ 칩 레이스
  • 🎹당신의 음악을 만드세요 ‘유디오’
  • 👀머스크의 멀티모달 모델 ‘그록-1.5V’
  • 🧑‍💻더밀크가 주목한 뉴스

안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 AI 뉴스레터 [박원익의 AI인사이트]입니다.  


한 주 동안 쏟아지는 AI 뉴스 홍수 속에서 놓치지 않고 꼭 챙겨봐야 할 정보를 선별해 드립니다. 핵심 요약으로 독자분들이 시간을 아낄 수 있도록 돕고 ‘실리콘밸리+실리콘앨리’ 현장에서 빅테크, 유망 스타트업의 움직임을 취재하는 더밀크만의 인사이트를 추가했습니다. 보다 자세한 내용은 더 알아보기 링크로 확인하실 수 있습니다.

🏇구글, 메타는 왜 반도체 사업에 뛰어드나? 

구글이 최초 공개한 자체 개발 CPU Axion (출처: Google)

팩트 요약: 구글, 메타의 AI칩 공습, 인텔의 반격

1. 구글이 CPU 시장에도 진입했습니다. 지난 9일 ARM 기반 새 CPU(중앙처리장치) ‘액시온(Axion)’을 최초 공개한 것입니다. 인텔보다 성능은 50%, 에너지 효율은 60% 개선됐다는 설명입니다. 구글은 단위 성능이 4배 개선된 AI 가속기 ‘TPU v5p’도 출시했습니다.

2. 인텔이 맞불을 놨습니다. 같은 날 ‘인텔 비전’ 행사에서 AI 가속기 ‘가우디3(Gaudi 3)’를 공개한 것입니다. 엔비디아의 ‘H100’과 비교, 대규모 언어모델(LLM) 추론 처리 성능이 평균 50% 더 낫다는 게 인텔의 주장입니다.

3. 메타도 AI 칩 시장에 본격 참전합니다. 지난 10일 차세대 AI 칩 ‘MTIA’ 최신 버전(v2)을 공개한 것입니다.

왜 중요한가:

“생성 AI의 잠재력은 인프라에 달렸다”
토마스 쿠리안 구글 클라우드 CEO가 지난 9일(현지시각) ‘구글 클라우드 넥스트 2024’에서 한 말입니다. 강한 컴퓨팅 성능과 클라우드 인프라가 생성 AI 서비스의 성패를 좌우한다는 것이죠. MS-오픈AI도 뛰어들 예정이기 때문에 앞으로 플랫폼, 서비스 업체가 인프라도 보유한 '서비스-인프라' 일체화 현상이 계속될 것입니다. 

👉더밀크 인사이트
👉더 알아보기: 구글의 전략 ‘기업용 AI 에이전트’란?

🎹 음악도 한계 비용 제로 시대

음악 생성 AI 유디오(Udio) 웹사이트 화면 (출처: 웹사이트 캡처)

팩트 요약: 유디오 쇼크

1. 스타트업 유디오(Udio)는 텍스트를 입력하면 40초 이내 음악을 생성할 수 있는 서비스입니다. 길이를 더 늘리거나 줄일 수 있습니다. 유디오는 구글 딥마인드 출신 연구원들이 설립했습니다.

2. EDM, 재즈, 네오 소울, 메탈 등 다양한 장르의 음악을 생성하며 감미로운 보컬도 추가할 수 있습니다. 한국어를 포함한 다양한 언어로 보컬을 생성, K팝, J팝, 발리우드 음악을 만들 수도 있습니다.

3. 내가 만든 음악을 유디오 웹사이트에 올려 다른 사람에게 공개할 수 있습니다. 유튜브 등 다른 소셜미디어와 비슷한 방식입니다. 아직 베타 버전으로 현재 무료로 서비스되고 있습니다.

왜 중요한가:
“어떻게 이런 일이 가능하죠?”, “놀라움과 동시에 소름 돋는 공포감이 생기네요.”

생성 AI 기반 음악 창작 앱 유디오의 시연 영상을 본 사람들은 X(옛 트위터)에 이런 반응을 올렸습니다. 음악 전문지 롤링 스톤은 “음악 AI 군비 경쟁이 시작됐다. 유디오는 음악을 위한 챗GPT”라고 평했습니다.

생성 AI 2막에서는 애플리케이션(application, 응용 프로그램), 서비스 기업이 더 크게 성장할 것으로 예상합니다. 스마트폰 시대에 페이스북이 급성장했던 것처럼 생성 AI 시대에도 비슷한 일이 벌어질 것이란 관측입니다. 음원 등 디지털 서비스의 '한계비용(상품 한 단위를 더 생산하는 데 추가로 부담하는 비용) 제로' 시대가 도래하고 있는 것입니다. 음원 생성AI 도구는 일반인들의 음악 산업 진입 장벽을 낮춰 비전문가도 음원을 만들 수 있게 해 결과적으로 새로운 시장을 창출할 것입니다. 

👉더밀크 인사이트
👉더 알아보기: 스태빌리티 AI의 몰락

👀머스크의 멀티모달 모델 ‘그록-1.5V’

xAI는 최초의 멀티모달(Multimodal, 다중모드) 모델 ‘그록-1.5V’를 출시했다. (출처: xAI)

핵심 요약: 머스크AI, 왜 소리만 요란한가?

1. xAI는 12일 멀티모달(Multimodal, 다중모드) 모델 ‘그록-1.5V’를 출시했습니다. 텍스트와 함께 문서, 차트, 사진, 스크린샷, 다이어그램 등 다양한 시각적 정보를 처리할 수 있습니다.

2. xAI는 벤치마크(성능 평가)에서 그록-1.5V가 오픈AI의 멀티모달 모델 GPT-4V, 앤트로픽의 ‘클로드3 오푸스’ 등을 뛰어넘었다고 밝혔습니다. 특히 “물리적 세계를 이해하는 기능에 큰 기대를 걸고 있다”고 언급한 대목이 관심을 끕니다.

왜 중요한가:

일론 머스크는 자신이 설립한 AI 기업 ‘엑스AI(xAI)’를 통해 잇따라 파격적 행보를 보여주고 있습니다. 첫 LLM ‘그록(Grok)-1’을 오픈소스로 공개했고, 5월 중 오픈AI의 GPT-4 성능에 근접한 ‘그록-2.0’의 훈련을 마칠 것이라고 밝혔습니다. 이번 그록-1.5 V는 xAI 최초의 멀티모달 모델이라는 점에서 또 한 번 업계의 이목을 끌고 있습니다.

하지만 관심을 끄는 것과 별개로 실제로 그록을 사용하고 있다는 사람은 많지 않습니다. LLM의 경쟁력은 '주장'에서 나오는 게 아니죠. 정식 출시했음에도 사용자가 적다는 점은 xAI가 해결해야 할 숙제일 것입니다. 


👉더밀크 인사이트
👉더 알아보기: Grok-1.5 Vision 프리뷰

(주)이엠디넷

대표자 : 조종현 ㅣ 주소 : 서울특별시 금천구 가산디지털1로 219,
1105호(가산동, 벽산디지털밸리6차) ㅣ TEL : 02-2627-3799 ㅣ
E-mail :manager@emdinet.com ㅣ사업장등록번호 : 220-86-77728


Copyright ⓒ EMDNET All rights reserved.  I  Hositing by I'MWEB

(주)이엠디넷

대표자 : 조종현 ㅣ 주소 : 서울특별시 금천구 가산디지털1로 219, 1105호(가산동, 벽산디지털밸리6차)

TEL : 02-2627-3799 ㅣ E-mail : manager@emdinet.com ㅣ 사업장등록번호 : 220-86-77728


Copyright ⓒ EMDNET All rights reserved.  I  Hositing by I'MWEB