하드웨어 초당 45조번 연산... 애플도 인텔도 이젠 '뇌 닮은 괴물칩' NPU 전쟁
2024.07.14 06:24
'온디바이스 시대' 열리자… 차세대 AI 칩으로 각광
올해 인공지능(AI) 서비스를 인터넷 연결 없이 사용할 수 있도록 기기 자체에 탑재한 ‘온디바이스(내장형) AI 스마트폰·PC’ 시장이 본격적으로 열리고 있다. 기기에서 곧바로 실시간 통역 같은 AI 서비스를 이용하려면, 연산 속도가 획기적으로 빠른 반도체(칩)가 필수적이다. 이렇게 AI 연산 성능을 좌우하는 핵심 부품이 신경망처리장치(NPU) 칩이다. NPU는 작동 원리가 사람의 뇌와 비슷하다고 해서 이런 이름이 붙었다. 뇌의 신경세포가 신호를 주고받듯, 칩 안에서 신호를 주고받으며 연산을 처리한다.
특히 AI 학습에 많이 쓰이는 그래픽처리장치(GPU)보다 전력 소모가 적어 차세대 AI 칩으로 각광받고 있다. 애플은 지난 7일 초당 38조번 연산이 가능한 NPU가 탑재된 반도체 M4 프로세서를 공개했다. 미국 반도체 회사 퀄컴은 초당 45조번 연산을 하는 NPU가 탑재된 ‘스냅드래건 X 플러스’ 칩을 하반기 출시 노트북에 본격 탑재한다. 인텔은 연말 출시할 노트북용 칩의 성능을 45조번 연산이 가능한 수준으로 끌어올리는 작업을 추진 중이다. IT업계 관계자는 “현재 시장에 나와있는 NPU 칩은 1초에 10조번대 연산 성능을 갖고 있는데, 1년 만에 3배 넘는 성능을 가진 칩이 나온 것”이라고 했다.
◇AI 구현의 핵심, NPU
최근 등장하는 ‘괴물 NPU’가 들어간 노트북과 스마트폰은 인터넷 연결 없이도 코딩·음악 작곡·자막 생성 같은 대규모 연산이 필요한 기능을 이용할 수 있다. 초고화질 영상에서 배경과 피사체를 분리하고, 피아노 연주를 실시간 악보로 전환해 주는 작업을 한다. 예전에는 전문 기기나 인터넷에 연결해 전문 프로그램을 사용해야 가능한 기능들이었다. 퀄컴은 “자사 NPU를 활용하면 영상 속 언어 100개를 실시간으로 번역할 수 있다”고 했다.
NPU의 성능을 빠른 속도로 높일 수 있었던 데에는 초미세 공정 기술과 패키징(최종 조립) 기술 발전이 한몫했다. NPU는 저전력이 핵심이다. 7나노미터(10억분의 1미터) 이하 초미세 공정이 사용되면서 좁은 공간 안에 효율적인 회로 설계가 가능해졌다. 또 첨단 패키징 기술을 통해 기기 속 좁은 공간에 더 많은 반도체를 넣을 수 있게 됐다.
NPU는 스마트폰·PC를 중심으로 기존에 GPU를 활용하는 AI 반도체를 빠르게 대체할 전망이다. GPU가 들어가는 AI 반도체는 성능이 뛰어나지만, 비싸고 전력을 많이 쓰는 단점이 있다. 크기도 커서 스마트폰과 PC에는 탑재할 수 없다. 비교적 저렴하면서 전력 소비가 적고, 크기도 작은 NPU에 대한 수요가 늘어날 수밖에 없다. 특히 마이크로소프트가 자사 생성형 AI 서비스 ‘코파일럿’을 윈도 노트북에 기본 탑재하는 방향으로 나아가면서, 제조사들 사이에서 NPU를 활용해 AI 기능을 기기에 탑재하는 경향이 더 강해지고 있다. 다만 NPU는 머신 러닝에 특화된 칩으로, GPU가 수행하는 그래픽 처리 같은 역할은 할 수 없는 것이 단점이다.
◇AI PC·스마트폰 시장 열린다
스마트폰과 PC 제조사들은 NPU를 활용한 온디바이스 AI가 게임 체인저가 될 것으로 보고 있다. 기술 정체와 불경기로 스마트폰과 PC 시장이 위축되고 있는 가운데, 새로운 기능으로 소비자들한테 어필할 수 있기 때문이다. 이미 삼성전자는 1월 AI 기능이 탑재된 갤럭시 S24 시리즈를 출시해, 2019년 이후 최대 1분기 판매량을 기록했다. 카운터포인트리서치는 지난해부터 2027년까지 AI 노트북 누적 판매량이 5억대에 이를 것으로 예상했다. 2027년 판매되는 휴대용 PC 4대 중 3대는 AI를 지원하는 제품일 것이라고도 했다.
AI 학습용 서버를 구축하기 위한 NPU 시장도 생겨나고 있다. 엔비디아의 GPU 가격이 대당 5000만원(H100)을 넘기면서, 합리적인 비용으로 비슷한 성능을 내는 NPU 가속기를 대안으로 찾고 있는 것이다. 삼성전자는 추론에 특화된 AI 가속기 ‘마하1′을 개발 중인데, GPU 기반이 아닌 NPU 기반으로 만들어진다. 대표적인 국내 AI 칩 스타트업 리벨리온과 퓨리오사도 NPU를 활용한 AI 칩을 설계해 시장에서 인정받았다.
☞NPU
신경망 처리 장치(NPU· Neural Processing Units)로 인간의 두뇌를 모방한 AI 반도체다. 인간 뇌가 수많은 신경세포가 서로 연결돼 신호를 주고받으며 작동하는 것과 같은 원리가 적용됐다. 인터넷 연결 없이도 실시간으로 빠르게 데이터를 처리하고 사람처럼 생각하고 학습할 수 있어, 딥러닝에 최적화된 기술로 평가받는다.