<에코용어사전> 생성형 AI? 딥러닝? AI데이터센터? 복잡다단 “AI 용어” 총정리
AI 기술이 빠르게 발전하면서 하루가 다르게 AI 관련 용어들이 늘어나고 있습니다. 비슷하지만 다르고, 다르지만 결국 연결되는 AI 용어의 복잡한 알고리즘 속에서 정확한 의미 값을 찾아 나서 봅시다.
AI(Artificial Intelligence, 인공지능)는 인지, 학습, 추론 등 인간의 지적 능력을 컴퓨터로 구현한 ‘인공 지성체’로,
이를 구현하기 위한 기술이나 그 연구 분야를 총칭하는 용어입니다.
간단히 말하자면, 인간처럼 생각하고 행동하는 컴퓨터를 만드는 것이라 할 수 있죠.
최근 AI 기술은 복잡한 연산이나 데이터 검색 등을 돕는 이전의 수준에서 훨씬 더 나아가,
학습한 데이터를 기반으로 새로운 데이터를 생성해내는 단계까지 도달해
작문, 작곡, 영상 제작과 같은 창작의 영역까지 진출하고 있는데요.
이처럼 우리의 업무와 일상 곳곳에 사용되고 있는 AI를 더 깊이 이해하기 위해
이번 에코용어사전에서는 AI 관련 주요 용어들을 자세히 살펴봤습니다.
.
가장 먼저 살펴볼 용어는 ‘머신러닝(Machine Learning)’과 ‘딥러닝(Deep Learning)’입니다.
머신러닝은 AI의 하위 분야로, 컴퓨터가 기존에 학습한 데이터들에 기반해
스스로 답을 찾을 수 있도록 하는 기술을 뜻합니다.
주어진 데이터들로부터 찾아낸 규칙으로 *알고리즘(Algorithm)을 구축하고,
새로운 데이터를 만났을 때 이 알고리즘에 따라 결과를 도출하는 것인데요.
예를 들면, 수많은 고양이 이미지를 통해 다른 동물과 구분되는 고양이의 특징을 학습시키고,
새로운 이미지가 입력되었을 때 고양이인지 아닌지 식별하도록 하는 식이죠.
*알고리즘: 컴퓨터 과학 등에서 사용되는 문제 해결을 위한 단계적 규칙과 절차, 동작들의 모임.
머신러닝은 적은 양의 데이터로도 학습이 가능해서
이미 금융, 의료, 물류 등의 다양한 분야에서 활용되고 있답니다.
.
딥러닝은 인간의 뇌구조를 모방한 ‘인공신경망’을 기반으로 학습하는 머신러닝의 일종입니다.
뉴런들이 복잡한 구조로 얽혀 거대한 신경망을 구성하는 인간의 뇌처럼,
수백, 수천 개의 층으로 깊게(Deep) 쌓아올린 인공신경망으로
이미지, 음성, 텍스트 등의 다양한 데이터들을 고차원적으로 학습하고
분석해 문제를 해결하는 기술이죠.
도로의 상태를 분석해 스스로 운전을 하는 자율주행 자동차,
다양한 변수에도 정확히 사람을 분류해 내는 얼굴인식, 음성인식 등이
모두 딥러닝을 활용한 것이랍니다.
또한 딥러닝은 학습에 필요한 데이터를 수동으로 제공해 주어야 하는 일반적인 머신러닝과 달리,
문제 해결에 필요한 데이터까지 스스로 학습할 수 있는데요.
보통의 머신러닝이 수동으로 “이게 고양이야”라고 데이터 특징을 알려줘야 한다면,
딥러닝은 여러 상황을 종합적으로 분석해 “이게 고양이군”이라고 스스로 배우는 것이죠.
이러한 특징들 때문에 딥러닝은 정확도를 위한 엄청난 양의 데이터를 필요로 한답니다.
.
최근 열풍의 중심에 있는 ‘생성형 AI(Generative AI)’,
한 번쯤 들어보셨을 텐데요.
생성형 AI는 딥러닝을 기반으로 텍스트, 이미지, 음악, 영상 등의 기존 콘텐츠를 학습 및 추론해,
새로운 콘텐츠를 ‘생성’하는 데 중점을 둔 AI 모델입니다.
이미 ‘챗GPT(ChatGPT)’나 ‘미드저니(Midjourney)’와 같은 생성형 AI 서비스들은
우리 일상에 빠르게 스며들어 문서작성, 코딩, 이미지 제작 등 다양한 분야에서 널리 활용되고 있죠.
.
생성형 AI와 관련된 용어들도 새롭게 등장하고 있는데요.
대표적인 용어가 ‘프롬프트 엔지니어링(Prompt Engineering)’입니다.
‘프롬프트 엔지니어링’은 생성형 AI에게서 원하는 최적의 결과 값을 얻어내기 위해
입력하는 질문(Prompt)을 설계하고 구조화하는 기술을 뜻합니다.
최근 ‘프롬프트 엔지니어’라는 새 직업군까지 등장했을 정도로, 그 중요성이 강조되고 있죠.
.
‘멀티모달(Multimodal)’ 역시 생성형 AI를 설명할 때 빼놓을 수 없는 중요한 용어입니다.
AI 분야에서 ‘모달리티(Modality)’는 텍스트, 이미지와 같은 데이터의 종류와 형태를 뜻하는데요.
멀티모달은 다양한 유형의 데이터(모달리티)를 종합적으로 고려해 서로의 관계성을 학습하고 처리하는 AI 기술을 말하죠.
.
멀티모달 개념이 적용되기 전 초기 생성형 AI에는
‘거대언어모델(LLM, Large Language Model)’이 활용됐습니다.
거대언어모델은 대량의 인간 언어를 이해해 작문, 번역 등의 텍스트 데이터를 생성하는 AI로,
학습 대상이 언어, 즉 텍스트 데이터에 한정되어 있었는데요.
이후 멀티모달 개념이 적용된 ‘거대멀티모달모델(LMM, Large Multimodal Model)’이 도입되면서
텍스트 외에도 다양한 데이터 유형을 학습 및 처리할 수 있게 되었고,
덕분에 생성형 AI의 영역 역시 이미지, 영상, 음성 등으로 대폭 확대될 수 있었습니다.
.
이제는 오프라인으로 눈을 좀 돌려볼까요?
AI를 포함한 IT 서비스 및 애플리케이션을 구현하기 위해서는
컴퓨터, 서버, 네트워크 시스템과 같이 데이터를 저장, 처리, 관리할 인프라가 필요합니다.
이 같은 IT 인프라가 보관된 물리적 시설 또는 건물을 ‘데이터센터(Datacenter)’라고 부르는데요.
앞서 살펴보았듯 엄청난 양의 데이터를 처리하고 생성해내는 딥러닝, 생성형 AI 등이 발달하면서
이전과는 차원이 다른 역량을 가진 데이터센터가 요구되고 있습니다.
이에 새롭게 등장한 것이 바로 ‘AI 데이터센터’입니다.
AI 데이터센터는 고속 입출력에 특화된 고대역폭 메모리(HBM, High Bandwidth Memory),
대규모 연산에 적합한 그래픽 처리장치(GPU, Graphic Processing Unit)와 같이
AI가 요구하는 대량의 데이터를 빠르게 처리할 수 있는 고성능 컴퓨팅 자원을 탑재하고,
고효율 냉각 시스템 및 전력 시스템을 갖춘 데이터센터를 뜻하죠.
빨라지는 AI 기술의 발전 속도만큼, 이러한 AI 데이터센터에 대한 수요도 급증하고 있는데요.
파이낸셜타임스(Financial Times)에 따르면, 지난해 마이크로소프트, 메타, 아마존, 구글 등 4개 빅테크의
자본지출 2,090억 달러(약 307조 원) 중 무려 80%가 AI 데이터센터에 투자된 것으로 추정된다고 합니다.
엔비디아 CEO인 젠슨 황 역시 “2024년 1조 달러(약 1,467조 원) 규모인 AI 데이터센터 시장이
5년 안으로 2배까지 늘어날 것”이라 전망하기도 했죠.
.
이 같은 폭발적인 시장 확대 상황에 대응해 여러 기업들이 AI 데이터센터 사업모델 구축에 공을 들이고 있는데요.
그 중에서도 SK에코플랜트의 행보에 주목할 필요가 있습니다.
SK에코플랜트는 데이터센터 사업개발부터
EPC(Engineering∙Procurement∙Construction, 설계∙조달∙시공) 역량뿐만 아니라,
고체산화물연료전지(SOFC, Solid Oxide Fuel Cell) 등 기존에 보유한 친환경 솔루션을 데이터센터에 적용하기까지,
독보적인 데이터센터 사업 밸류체인(Value-Chain)을 구축하고 있기 때문인데요.
실제로 최근 SK에코플랜트는 인천 부평구에 국내 최대 규모인 120MW 규모의 상업용 데이터센터를 조성하고 있는 등
정상급 데이터센터 디벨로퍼로서의 역량을 입증하고 있습니다.
.
여기 더해 SK에코플랜트는 E-Waste 리사이클링 전문 자회사인 SK tes를 통해
데이터센터 내 IT 자산들의 자원순환에 기여하며 사업의 지속가능성도 높여가고 있는데요.
특히 지난 해 3월, SK tes는 전세계 IT 기업들의 데이터센터가 밀집된 미국 버지니아에
*하이퍼스케일 데이터센터 전용 ITAD(IT Asset Disposition, IT자산처리서비스) 시설을 대규모로 준공하며
새로운 시장을 선도할 준비를 마치기도 했죠.
*하이퍼스케일 데이터센터(Hyperscale Data Center, HDC): 1만㎡가 넘는 연면적을 갖추고 10만 대 이상의 서버를 들여놓은 초대형 데이터센터.
한계를 모르고 발전하고 있는 AI!
앞으로는 또 어떠한 기술과 용어들이 새롭게 등장하게 될까요?
그리고 그 시대를 이끌어갈 주역은 누가 될까요?
AI가 만들어 나갈 새로운 미래를 더욱 기대해봅니다!
연관 콘텐츠
<에코용어사전> 생성형 AI? 딥러닝? AI데이터센터? 복잡다단 “AI 용어” 총정리
AI(Artificial Intelligence, 인공지능)는 인지, 학습, 추론 등 인간의 지적 능력을 컴퓨터로 구현한 ‘인공 지성체’로,
이를 구현하기 위한 기술이나 그 연구 분야를 총칭하는 용어입니다.
간단히 말하자면, 인간처럼 생각하고 행동하는 컴퓨터를 만드는 것이라 할 수 있죠.
최근 AI 기술은 복잡한 연산이나 데이터 검색 등을 돕는 이전의 수준에서 훨씬 더 나아가,
학습한 데이터를 기반으로 새로운 데이터를 생성해내는 단계까지 도달해
작문, 작곡, 영상 제작과 같은 창작의 영역까지 진출하고 있는데요.
이처럼 우리의 업무와 일상 곳곳에 사용되고 있는 AI를 더 깊이 이해하기 위해
이번 에코용어사전에서는 AI 관련 주요 용어들을 자세히 살펴봤습니다.
.
가장 먼저 살펴볼 용어는 ‘머신러닝(Machine Learning)’과 ‘딥러닝(Deep Learning)’입니다.
머신러닝은 AI의 하위 분야로, 컴퓨터가 기존에 학습한 데이터들에 기반해
스스로 답을 찾을 수 있도록 하는 기술을 뜻합니다.
주어진 데이터들로부터 찾아낸 규칙으로 *알고리즘(Algorithm)을 구축하고,
새로운 데이터를 만났을 때 이 알고리즘에 따라 결과를 도출하는 것인데요.
예를 들면, 수많은 고양이 이미지를 통해 다른 동물과 구분되는 고양이의 특징을 학습시키고,
새로운 이미지가 입력되었을 때 고양이인지 아닌지 식별하도록 하는 식이죠.
*알고리즘: 컴퓨터 과학 등에서 사용되는 문제 해결을 위한 단계적 규칙과 절차, 동작들의 모임.
머신러닝은 적은 양의 데이터로도 학습이 가능해서
이미 금융, 의료, 물류 등의 다양한 분야에서 활용되고 있답니다.
.
딥러닝은 인간의 뇌구조를 모방한 ‘인공신경망’을 기반으로 학습하는 머신러닝의 일종입니다.
뉴런들이 복잡한 구조로 얽혀 거대한 신경망을 구성하는 인간의 뇌처럼,
수백, 수천 개의 층으로 깊게(Deep) 쌓아올린 인공신경망으로
이미지, 음성, 텍스트 등의 다양한 데이터들을 고차원적으로 학습하고
분석해 문제를 해결하는 기술이죠.
도로의 상태를 분석해 스스로 운전을 하는 자율주행 자동차,
다양한 변수에도 정확히 사람을 분류해 내는 얼굴인식, 음성인식 등이
모두 딥러닝을 활용한 것이랍니다.
또한 딥러닝은 학습에 필요한 데이터를 수동으로 제공해 주어야 하는 일반적인 머신러닝과 달리,
문제 해결에 필요한 데이터까지 스스로 학습할 수 있는데요.
보통의 머신러닝이 수동으로 “이게 고양이야”라고 데이터 특징을 알려줘야 한다면,
딥러닝은 여러 상황을 종합적으로 분석해 “이게 고양이군”이라고 스스로 배우는 것이죠.
이러한 특징들 때문에 딥러닝은 정확도를 위한 엄청난 양의 데이터를 필요로 한답니다.
.
최근 열풍의 중심에 있는 ‘생성형 AI(Generative AI)’,
한 번쯤 들어보셨을 텐데요.
생성형 AI는 딥러닝을 기반으로 텍스트, 이미지, 음악, 영상 등의 기존 콘텐츠를 학습 및 추론해,
새로운 콘텐츠를 ‘생성’하는 데 중점을 둔 AI 모델입니다.
이미 ‘챗GPT(ChatGPT)’나 ‘미드저니(Midjourney)’와 같은 생성형 AI 서비스들은
우리 일상에 빠르게 스며들어 문서작성, 코딩, 이미지 제작 등 다양한 분야에서 널리 활용되고 있죠.
.
생성형 AI와 관련된 용어들도 새롭게 등장하고 있는데요.
대표적인 용어가 ‘프롬프트 엔지니어링(Prompt Engineering)’입니다.
‘프롬프트 엔지니어링’은 생성형 AI에게서 원하는 최적의 결과 값을 얻어내기 위해
입력하는 질문(Prompt)을 설계하고 구조화하는 기술을 뜻합니다.
최근 ‘프롬프트 엔지니어’라는 새 직업군까지 등장했을 정도로, 그 중요성이 강조되고 있죠.
.
‘멀티모달(Multimodal)’ 역시 생성형 AI를 설명할 때 빼놓을 수 없는 중요한 용어입니다.
AI 분야에서 ‘모달리티(Modality)’는 텍스트, 이미지와 같은 데이터의 종류와 형태를 뜻하는데요.
멀티모달은 다양한 유형의 데이터(모달리티)를 종합적으로 고려해 서로의 관계성을 학습하고 처리하는 AI 기술을 말하죠.
.
멀티모달 개념이 적용되기 전 초기 생성형 AI에는
‘거대언어모델(LLM, Large Language Model)’이 활용됐습니다.
거대언어모델은 대량의 인간 언어를 이해해 작문, 번역 등의 텍스트 데이터를 생성하는 AI로,
학습 대상이 언어, 즉 텍스트 데이터에 한정되어 있었는데요.
이후 멀티모달 개념이 적용된 ‘거대멀티모달모델(LMM, Large Multimodal Model)’이 도입되면서
텍스트 외에도 다양한 데이터 유형을 학습 및 처리할 수 있게 되었고,
덕분에 생성형 AI의 영역 역시 이미지, 영상, 음성 등으로 대폭 확대될 수 있었습니다.
.
이제는 오프라인으로 눈을 좀 돌려볼까요?
AI를 포함한 IT 서비스 및 애플리케이션을 구현하기 위해서는
컴퓨터, 서버, 네트워크 시스템과 같이 데이터를 저장, 처리, 관리할 인프라가 필요합니다.
이 같은 IT 인프라가 보관된 물리적 시설 또는 건물을 ‘데이터센터(Datacenter)’라고 부르는데요.
앞서 살펴보았듯 엄청난 양의 데이터를 처리하고 생성해내는 딥러닝, 생성형 AI 등이 발달하면서
이전과는 차원이 다른 역량을 가진 데이터센터가 요구되고 있습니다.
이에 새롭게 등장한 것이 바로 ‘AI 데이터센터’입니다.
AI 데이터센터는 고속 입출력에 특화된 고대역폭 메모리(HBM, High Bandwidth Memory),
대규모 연산에 적합한 그래픽 처리장치(GPU, Graphic Processing Unit)와 같이
AI가 요구하는 대량의 데이터를 빠르게 처리할 수 있는 고성능 컴퓨팅 자원을 탑재하고,
고효율 냉각 시스템 및 전력 시스템을 갖춘 데이터센터를 뜻하죠.
빨라지는 AI 기술의 발전 속도만큼, 이러한 AI 데이터센터에 대한 수요도 급증하고 있는데요.
파이낸셜타임스(Financial Times)에 따르면, 지난해 마이크로소프트, 메타, 아마존, 구글 등 4개 빅테크의
자본지출 2,090억 달러(약 307조 원) 중 무려 80%가 AI 데이터센터에 투자된 것으로 추정된다고 합니다.
엔비디아 CEO인 젠슨 황 역시 “2024년 1조 달러(약 1,467조 원) 규모인 AI 데이터센터 시장이
5년 안으로 2배까지 늘어날 것”이라 전망하기도 했죠.
.
이 같은 폭발적인 시장 확대 상황에 대응해 여러 기업들이 AI 데이터센터 사업모델 구축에 공을 들이고 있는데요.
그 중에서도 SK에코플랜트의 행보에 주목할 필요가 있습니다.
SK에코플랜트는 데이터센터 사업개발부터
EPC(Engineering∙Procurement∙Construction, 설계∙조달∙시공) 역량뿐만 아니라,
고체산화물연료전지(SOFC, Solid Oxide Fuel Cell) 등 기존에 보유한 친환경 솔루션을 데이터센터에 적용하기까지,
독보적인 데이터센터 사업 밸류체인(Value-Chain)을 구축하고 있기 때문인데요.
실제로 최근 SK에코플랜트는 인천 부평구에 국내 최대 규모인 120MW 규모의 상업용 데이터센터를 조성하고 있는 등
정상급 데이터센터 디벨로퍼로서의 역량을 입증하고 있습니다.
.
여기 더해 SK에코플랜트는 E-Waste 리사이클링 전문 자회사인 SK tes를 통해
데이터센터 내 IT 자산들의 자원순환에 기여하며 사업의 지속가능성도 높여가고 있는데요.
특히 지난 해 3월, SK tes는 전세계 IT 기업들의 데이터센터가 밀집된 미국 버지니아에
*하이퍼스케일 데이터센터 전용 ITAD(IT Asset Disposition, IT자산처리서비스) 시설을 대규모로 준공하며
새로운 시장을 선도할 준비를 마치기도 했죠.
*하이퍼스케일 데이터센터(Hyperscale Data Center, HDC): 1만㎡가 넘는 연면적을 갖추고 10만 대 이상의 서버를 들여놓은 초대형 데이터센터.
한계를 모르고 발전하고 있는 AI!
앞으로는 또 어떠한 기술과 용어들이 새롭게 등장하게 될까요?
그리고 그 시대를 이끌어갈 주역은 누가 될까요?
AI가 만들어 나갈 새로운 미래를 더욱 기대해봅니다!