티스토리 뷰

반응형

인공지능의 시작

인공지능이 처음 등장할 때는 1950년대로 이미 70년이나 연구된 분야다.

인공지능(Artificial Intelligence, AI)이라는 단어는 1956년 여름, 미국 다트머스 대학교에서 열린 다트머스 워크숍에서 처음 만들어졌다. LISP 프로그래밍 언어를 창시한 존 메카시가 기획하고, MITAI 랩을 개설한 마빈 민스키와 유전자 알고리즘을 창시한 존 홀랜드 등 이후 인공지능의 대가가 된 이들이 다수 참석하여 6주간 브레인스토밍을 진행했다고 한다. 이 워크숍 이후 인공지능이 새로운 학문으로 발전하고 인정받게 된다.

 

인공지능을 명확하게 정의하기 어려운 이유는 지능의 정의를 내리기 어렵기 때문이다. 지능이 무엇인지, 지능이 있는지 어떻게 확인할 수 있는지 쉽게 답하기 어렵다.

2가지 유형으로 나뉘는데 인간처럼 생각하고 감정을 가지며 창의성을 발휘하는 인공지능을 강한 인공지능’, 인간의 지능을 모방하여 특정한 문제의 답을 찾는 인공지능을 약한 인공지능이라 부른다. 아직은 세상에 약한 인공지능만 나온 셈이다. 그러나 실제 인간의 추리 수준까지 도달하지는 못했더라도 사람에게 사람처럼 보이는 강한 인공지능은 조만간 출현할 것으로 보인다.

 

인공지능 발전에 돌파구를 연 기술

인공지능 연구 역사가 70년이나 된 데에서 알 수 있듯 인공지능은 갑자기 최근 부상한 분야가 아니라 연관 기술 발전과 시장 형성 여부에 따라 침체와 돌파를 반복하며 발전해 왔다.

클라우드 컴퓨팅

대용량 슈퍼컴퓨터가 필요하던 것에서 퍼스널 컴퓨터 성능의 비약적 발전으로 기존 컴퓨터 모델이 교체됐고, 이제 데이터센터를 저장 관리할 필요 없는 클라우드 컴퓨팅으로 인해 또 한 번 인공지능이 획기적으로 발전할 발판을 마련했다.

사물인터넷

인터넷이 활성화되며 언제 어디서건 사물에 인터넷 연결과 데이터 처리 능력을 부여해 데이터 수집, 분석, 제어가 가능한 똑똑한 사물로 만드는 기술이다. 사물인터넷을 통해 수집되고 모든 분야에서 빠르게 쌓이는 빅데이터로 인공지능을 학습시키고 있다. 그러나 인간이 포착하고 분류한 데이터는 인공지능이 다음 단계로 도약하기에는 품질과 다양성이 충분하지 않다. 따라서 가상 세계에서 합성한 데이터를 대량 생성하여 인공지능에 활용하게 될 것이다.

GPU 칩세트 발전

학습에 필요한 병렬 연산이 매우 빨라졌다.

 

인공지능이 답을 찾는 방식

인공지능이 답을 찾는 방식, 즉 인공지능 시스템을 만드는 데 쓰이는 방법론은 크게 지식 기반 방법론과 데이터 기반 방법론이 있다. 지식 기반 방법론은 개발자가 지식을 잘 정리해서 규칙을 만들면 인공지능이 그에 따라 의사결정을 하는 방식이다. 짧은 시간 어느 정도 수준이 있는 시스템을 만들기에 적합하나 예외가 많고 복잡한 사안을 처리하는 데는 어려움이 많다.

데이터 기반 방법론은 수많은 데이터를 분석한 뒤 자동으로 지식을 추출해 문제를 푸는 방식으로 빅데이터 지원이 용이해진 오늘날 데이터 기반 방식인 딥러닝이 인공지능 분야를 평정했다.

 

인공지능 핵심 분야

인공지능이 가장 포괄적인 연구 분야이고 하위 분야로 머신러닝, 인공신경망, 딥러닝 순으로 포함 관계를 갖는다.

 

머신러닝:

컴퓨터가 학습을 통해 성능을 개선하는 알고리즘과 기술을 개발하는 분야다. 주로 데이터를 기반으로 데이터의 패턴에 대한 추정치를 생성하는 모델을 만들고 이에 근거하여 예측하거나 분류하는 의사결정 프로세스를 갖는다.

인공신경망:

동물의 신경세포, 두뇌 신경망을 모사한 뉴런 모델이 기반이 된다. 하나의 노드에서 출발, 노드들의 집합인 한 개 이상 층으로 만들어진 구조다.

뉴런의 수상돌기(자극 감지)-수초(전달)-축삭 말단(다른 뉴런이나 기관에 출력)처럼 입력층-은닉층-출력층으로 구성된다. 양질의 많은 데이터 세트를 확보하고 지도 학습을 통해 가중치와 편향 값을 업데이트한다.

출처: 한겨레 사이언스온

딥러닝:

다수의 은닉층을 갖는 깊은 신경망을 사용하여 추상화 수준이 높은 특징을 추출하는 머신러닝 알고리즘의 하나다. 이 또한 동물의 두뇌에서 일어나는 인식 방법과 흡사하다. 이 덕분에 대규모 이미지 데이터에 대한 인식률이 크게 높아져 인공지능이 폭발적 관심을 받게 되었다.

출처: fresh desk

 

머신러닝과 딥러닝 비교

  머신러닝 딥러닝
공통점 명시적으로 규칙을 프로그래밍하지 않고 데이터로부터 의사 결정을 위한 패턴을 기계가 스스로 학습
차이점 주로 정형 데이터를 다룸
표로 정리되는 테이블 데이터를 사람이 정리해 기계에 알려주면 기계가 판단, 예측
입력->특징 추출->분류->출력의 과정
비정형 데이터를 다룸
이미지, 비디오, 텍스트, 음성 등
입력->특징 추출+분류 동시에->출력

 

현재 주목받는 인공지능 기술

대화형 인공지능:

자연어 처리는 물론 음성과 텍스트를 모두 활용하여 인간과 기계가 상호작용하게 함

다중감각 인공지능: 청각, 언어지능 등 여러 감각 기능을 통합해 사람처럼 인지하고 표현할 수 있으며 다양한 지능을 서로 연결해 구현하는 기술

멀티모달 머신러닝:

다중감각 인공지능이 발전한 형태인데 사람처럼 여러 감각을 익혀 스스로 말하고 쓰고 움직이는 인공지능 모델이다. 엑스트 데이터는 기본이고 이미지, 음성, 제스처, 시선, 표정, 생체 신호 등 여러 입력 방식을 받아들이고 사고할 수 있어 인간과 AI가 더욱 자연스럽게 의사소통할 수 있게 한다. 앞으로 여러 산업 분야에서 혁신적 제품과 서비스를 개발하는 데 쓰일 것으로 기대된다. 구글은 75개 이상의 언어와 이미지, 비디오 등 다양한 정보를 이해할 수 있는 멀티모달 통합 모델을 발표했다.

오픈AI의 달리: 인터넷에서 수집한 방대한 이미지와 캡션들을 학습해 결과를 만들어 낸다. 그 결과 입력한 적이 없는 새로운 이미지도 학습 데이터를 조합해 만들어 낸다.

구글 이매젠(Imagen): 달리 2와 같은 방식으로 이미지를 만들되 텍스트를 이해하는 대형 변환기와 언어모델 성능이 좋아 정확도가 높은 이미지를 만들어낸다.

LG AI 연구원 엑사원: 달리와 비슷한 성능을 갖되 텍스트와 이미지, 이미지와 텍스트 등 모달리티 간 양방향 사고가 가능한 모델을 20211214, 세계 최초로 구현했다. 즉 이미지를 보고 이를 텍스트로 설명하는 것까지 가능한 것이다.

카카오브레인 민달리(minGALL-E): 20211215일 발표. RQ-트랜스포머-민달리의 상위 버전으로 2022419일 발표. 독자기술이고 민달리에 비해 모델 크기가 3, 이미지 생성 속도와 학습 데이터셋은 2배 늘어났다

 

인공지능이 대체하기 쉬운 일/직업

매뉴얼이 정해져 있고 반복성이 높은 직업/예) 텔레마케터

대량의 지식, 사례, 규칙, 규정을 축적해 그 안에서 형성한 패턴을 활용하거나 추출하여 작업하는 일/예) 세무 회계사, 변리사, 법률가, 은행원, 금융 분석가, 프로그래머, 데이터 분석가 (인공지능은 보수가 높은 기존 화이트칼라 직업군이 지닌 지식 형성에 매우 능하다. 따라서 화이트칼라 직업을 대체하기 쉽다)

 

인공지능이 대체하기 힘든 일/직업

사람을 직접 대하고 육체적 정신적 노동이 복합된 직업/예) 요양보호사

여러 업무를 복합적으로 해야 하는 일/예) 도서관 사서

창의성, 예술적 감성이 필요한 분야/예) 예술가, 크리에이터 (다수 AI 도구가 대본 창작, 회화 및 디자인에도 능하고 새로운 것까지 만들어 내고 있어 이 영역도 흔들리고 있음, 데이터와 패턴을 기반으로 창작하는 것이 아니라면 경쟁 여지는 있음)

단순하지 않은 문제 해결과 육체적인 노동이 결합한 일/예) 배관공 (인공지능 장착 로봇이 인간 수준으로 움직이려면 아직 요원함)

다양하고 정교한 신체 움직임이 필요한 일/예) 수영 강사, 댄스 강사, 무용가

반응형
최근에 올라온 글