정보통신 IT/인공지능 AI

챗GPT, ChatGPT, 생성형 인공지능, Generative AI, ChatGPT 활용, GPT 3.5 기반, Generative Pre-trained Transformer, 대화형 인공지능

Jobs 9 2023. 2. 13. 09:45
반응형

 

GPT 3.5를 기반으로 하는 대화형 인공지능. 간단한 회원가입 후 무료로 이용

ChatGPT는 사용자와 주고받는 대화에서 질문에 답하도록 설계된 언어모델이다. 오픈AI는 블로그 게시글을 통해 “챗GPT가 대화 형식으로 추가적인 질문에 답하고 실수를 인정하며 정확하지 않은 전제에 대해서는 이의를 제기하고 부적절한 요청을 거부할 수 있다”고 설명했다.  


예시
양자 컴퓨팅을 쉬운 문장으로 설명해 줘.
10살 아이의 생일축하를 위한 창의적인 아이디어 있어?
JavaScript로 HTTP 요청을 어떻게 보내?

 

가능한 것
유저가 대화에서 말한 것을 기억함
답변을 보고 사용자가 내용 수정을 요청할 수 있음
부적절한 요청은 거부할 수 있음

 

한계
잘못된 정보를 제공할 수 있음
유해하거나 편향적인 정보를 제공할 수 있음
2021년 이후의 지식은 제한되어 있음

 

특징
답변이 마음에 들지 않으면 Try Again 버튼으로 다른 답변을 요청할 수 있으며, 현재 답에 대해 긍정 또는 부정으로 평가할 수 있다. 

가능한 한 답변을 제공하려고 노력하나, 정치 색, 헤이트 스피치, 선정성등 사회통념상 논란이나 거부감이 들어간 답변은 거부하는 경우가 상당히 많다. 

기본적으로 간단한 개념에 대한 설명을 요청할 수 있으며(ex. 나무위키가 뭐야?), 특정 개념들에 대한 비교, 공통점, 차이점 등을 요청할 수도 있다.(ex. 나무위키와 위키피디아의 차이점은 뭐야?)

 

잠재성 및 한계
ChatGPT가 가진 잠재력은 무시하지 못할 수준인데, 구글의 모회사인 알파벳 CEO가 직접 언급할 정도로 경계하고 있을 정도다. 데이터가 더 쌓여 한계를 극복한다면 사용자가 직접 검색할 대상의 정보를 입력해야 하는 현 검색 문법을 아예 뒤바꿀 기술이 될 것이기 때문에, 장기적으로는 구글을 비롯한 모든 검색 엔진을 대체 할 수 있는 기술이기 때문이다. 이 때문에 이미 10억 달러를 투자했던 MS가 아예 100억 달러를 투자한다는 소문이 나오고 있을 정도로 이 AI가 가진 잠재력이 얼마나 되는지를 그대로 보여주고 있다.  
대부분의 인간 업무는 반복적인 작업으로 이루어져 있다. 자료 수집, 정리, 오류 검토 등이다. ChatGPT와 같은 자연어 인공지능은 이와 같은 작업들을 모두 자동화한다. 인간은 추상적인 명령만 내리면 된다.  
예를 들어 어떤 자료를 수집하고 싶다면, 이전에는 일일이 보고서와 논문을 열람해 한땀한땀 모아야 했다. 앞으로는 명령만 내리면 AI가 크롤링하여 즉각 제공한다. 변호사, 노무사, 회계사 상담처럼 비슷한 내용이 반복되는 전문가 조언도 인공지능으로 대체 가능하다. 레퍼런스가 많으며 결과물이 정형화되어있기 때문이다(결국 미국 법정에서 AI 변호사가 등장했다.#). 반복적 코딩 업무는 최소화되며, 컴퓨터 엔지니어들은 새로운 구조와 아이디어만 짜내면 된다.  
아무리 고도화된 업무라고 할지라도 그 내용이 반복적이라면 AI의 생산성 우위를 이기기 어렵다. 결과적으로 지식과 기술의 발전 속도가 이전보다 훨씬 빨라지며, 더 소수의 인력으로도 더 높은 생산성을 낼 수 있다.  
예술 작품 창작의 과정도 많은 부분 반복적인 업무로 구성되어있다. 스토리의 구성, 자료수집, 철학적 구조의 설정, 윤문 등에 도움을 받는다면 창작의 과정이 매우 빨라진다. 
사람과 사람 사이의 상호작용도 많은 부분이 패턴화되어있다. 수년 안에 AI와 친구가 되거나 AI를 반려자로 삼는 사람이 등장할 수 있다. 
하지만 이러한 잠재적인 문제도 존재하기 때문에 섣부른 예측은 금물이다. 빅데이터 봇이라 그런지 영어로 질문하면 한국어로 질문할 때보다 정확도가 올라가긴 하지만, 100% 정확한 건 아니다. 
특히 기계학습 인공지능 모델들의 고질적 문제인 편향성 문제에서 자유롭지 못하다. 인공지능이 가치중립적일 것 처럼 보여도 결국 인공지능이 학습하는 것은 인간이 만든 데이터들이기 때문에 편향성에서 자유로울 수가 없다. 비교적 그런 문제에서 자유로운 편인 그림, 음악, 게임 알고리즘 부류와 달리 온갖 지식을 다루는 ChatGPT 특성상 편향성 문제가 강하게 드러날 잠재적 위험성이 크다. 게다가 제작진이 직접 개입하여 금지 사항을 정하고 가이드라인을 주입하기 때문에 더더욱 인위적인 편향성 문제가 생겨난다. 즉, 논란의 여지가 많은 질문일수록 대답을 신뢰하지 않는 것이 좋다. 
ChatGPT 때문에 미국 교육계는 완전히 뒤집어졌다고 해도 과언이 아닐 정도로 학생들의 부정행위의 빈도가 눈에 띄게 늘어났다. 이 때문에 일부 학교에서는 교외 시험 및 숙제를 전면 중단하고 교내 시험으로 대체하거나 ChatGPT 사이트를 차단하기까지에 이른다. 이에 대한 교사들의 생각도 제각각인데, 학생들의 창의력 저하를 우려하며 ChatGPT 사용을 금지하자는 의견과 ChatGPT는 사용하기에 따라 학업 능률을 끌어올려줄 '언어의 계산기'라며 본격적으로 커리큘럼에 도입해야 한다는 의견이 있다. 다만 과도기인만큼 보수적으로 접근하고 있으며, ChatGPT의 사용을 판단할 수 있는 GPTZERO를 모든 학교에 배포하는 선에서 일단 정리가 되었다.  
초대형 언어모델 때문에 서비스 운영에 어마어마한 비용이 발생하고 있다. OpenAI가 지불하는 비용이 쿼리 한 건당 수 센트에 달하는 것으로 추정되는데, 이는 ChatGPT가 현 시점에서는 지속 가능한 서비스가 아니며 마이크로소프트가 투자한 10억 달러를 태우면서 운영되고 있는 상태임을 시사한다. OpenAI는 최근 1개월당 42달러라는 유료화 계획을 발표했는데 이 액수가 결코 작은 액수가 아님에도 불구하고 이 비용으로도 현재 수준의 서비스를 지속적으로 제공할 수 있을지에 대한 회의적 시선이 존재한다. 

 

ChatGPT 활용


정보 검색 외에도 매우 다양한 용도로 사용할 수 있다.

 

자료수집
예를 들어 공학 연구자가 선행 연구 결과를 모아 새 가설을 테스트한다고 하자. 이전에는 논문과 책을 일일이 뒤지며 읽고 정리해야 했다. 이제는 인공지능에게 수집 명령을 내리기만하면 즉각 그래프까지 피팅해준다. 심지어 관련 이론과 수식, 유사한 역할을 하는 변수까지 곧장 찾아줄 것이다. 

 

코딩
사용자의 추상적인 요구를 분석해 목적에 부합하는 코드로 반환한다. 심지어는 부가적인 요구 사항(변수값, 임베디드의 경우 포트 번호 등)들도 전부 반영하여 코드를 작성해준다. 전문가의 경우 AI의 성능이 더 개선되면 수년내에 손코딩이 거의 사라질 것으로 내다보고 있다. 

 

교육용
인터넷과 문헌을 분석하여 원하는 정보를 제공한다. 임의의 텍스트를 입력하면 분석, 요약도 해준다.

 

번역기
사어도 지원하는데, 사어의 경우 가끔 안 될 때가 많다. 다른 언어를 번역해 보고 사어 번역을 명령하면 번역해 줄 확률이 올라간다. 마이너 언어로 된 문장을 번역하거나 마이너 언어로 번역하고 싶다면 ChatGPT를 이용하는 게 편하다. 그린란드어로 번역을 요구할 시 가끔 덴마크어로 번역해 주는 오류가 있다. 

 

계산기
울프럼알파처럼 함수를 정의하고 원하는 값을 도출하는것도 가능하며, 자연어가 가능한 만큼 실생활 속 예시를 그대로 옮겨 원하는 답을 얻을 수도 있다. 

 

문학 작품 창작 및 분석
내용을 입력하면 뒷 내용을 상상한 짧은 소설을 만들기도 한다. 작품을 학습시켜 짧은 팬픽을 쓰게 할 수도 있다. 한 사람이 투명드래곤의 분석을 요청했는데 뒤치닥의 문체를 흉내내어 뒷 내용을 상상한 짧은 팬픽을 만들기도 했다. 

 

오류
한계에서 명시한 것처럼, 가끔 잘못된 정보를 제공하기도 한다. 한국어가 영어보다 오류가 심하다.
또한 정해져 있는 답을 준비해놨다가 보여주는 것이 아니라 스레드마다 답변이 달라지므로 이 곳에 오류라고 명시되어있어도 다음에 같은 답을 내놓지 않을 가능성이 있으니 아래의 문장들을 "chatGPT가 생각하는 답"이라고 생각하기보단 "chatGPT가 100% 정확하지는 않다는 것을 보여주는 답변 예시들"이라고 생각하면 된다. 
나무위키와 위키피디아의 비교에서 나무위키가 공개 편집이 불가능한 위키라고 한다.
1972 뮌헨 올림픽/농구 결승전에서 미국이 소련을 51-50으로 이기고 금메달을 땄다고 나온다. 그런데 재검색을 해보면 이번에는 소련이 금메달을 땄다고 제대로 나오는 등 답변이 오락가락한다. 
김정은을 북한의 전 지도자라고 소개한다.
장제스를 일본 자유민주당의 최고 지도자라고 한다.
Mnet을 일본의 방송국으로 얘기한다.
가사를 물어보는 질문에 특히 약한 편이다. 아예 다른 가사를 말하는 경우도 있고 어느 정도 비슷하게 말하더라도 정확한 가사를 말하는 듯 하지만 중간에 다른 노래의 가사를 섞어서 답한다.
답변의 오류를 우회적으로 지적할 경우 그것에 대해 사과하면서 답변을 정정하는 경우가 있는데, 정정된 답변마저 내용에 오류가 포함되어 나오는 경우가 있다.
언어 관련해서 번역이 문법적으로 틀리는 경우가 있다. 문제는 자신이 앞에서 옳은 문법에 대해 설명해 놓고 뒤에 가서 그 자기가 설명해놓은 문법을 틀린다는 것. 다시 물어보면 자기가 틀렸다고 인정한다.
수학적 개념을 다룰 때는 영어를 사용 시에도 일부 오류를 보이는 경우가 있다. 예를 들어 “확률론 맥락에서, L^2공간이 L^1공간 내에서 조밀한가?”라고 영어로 질문하면, 잘못된 근거를 제시하며 조밀하지 않다고 답변한다. (실제로는 조밀하다.)
서버 용량이 가득 차서 구동이 안되는 상황이 빈번하다. 
실제로 2023학년도 수능 수학 문제를 물어보면 맞는 게 거의 없을 정도이다. (도함수와 같은 간단한 치환 문제도 여러 줄의 풀이 과정으로 장황하게 설명하여 답을 내놓지만 오답이다.) 
48÷2(9+3)는 관점에 따라 2 또는 288의 답변이 나올 수 있다. 그러나 ChatGPT는 2 또는 24라고 답한다.

 

정보와 팁
한 줄짜리 답변이 아니라 좀 더 구체적으로 답변을 듣고 싶을 때는 '10가지 이유', '예를 들어 10가지' 등 답변의 개수를 요구하는 문장을 붙이면 그대로 답변해준다. 20가지 30가지에도 반응을 해주지만 답변이 한정적일 경우 나머지 번호는 이미 한 대답을 돌려막기한다.  
학술 정보를 토대로 학습한 모델이기 때문에 연예, 시사 정보 등 논문에서 찾기 어려운 질문은 정확한 답변을 기대하지 않는 것이 좋다.  
코드 작성을 요청할 때는 어떤 프로그램에서 어떤 언어를 원하는 지 분명히 전달해야 한다. 예를 들어 "C# 언어로 Aseprite에서 사용할 ~하는 스크립트를 작성해줘" 라는 식으로 요청하면 된다.  
코드를 작성하는 답변이나 긴 글을 요구하는 답변을 할 경우 답변 도중에 정지되거나 에러 문구가 뜨면서 나왔던 답변까지 모두 사라지는데, 답변이 일시정지될 경우 버퍼에는 남아있기 때문에 'keep going'이라고 전송하면 나머지 답변을 이어서 보낸다. 답변이 모두 사라지고 에러 문구가 나타날 경우 재발 가능성이 높기 때문에 왼쪽 대화창에서 스레드를 삭제하고 새 스레드를 파는 것이 좋다.  
특히 답변 도중 정지되는 상황은 영어가 아닌 언어(한국어 등)로 사용할 시 더 짧은 시간에 자주 발생되니 긴 답변을 위주로 원활하게 사용하고 싶다면 영어를 쓰는 것이 좋다. 영어로 답변해달라고 요청하면 한국어로 질문해도 영어로 대답하기도 한다. 한국어의 경우 반말투를 쓰든 존댓말을 쓰든 대체로 비슷한 결과를 내놓는다.  

 

 

생성형 인공지능, Generative AI

 

생성형 인공지능, Generative AI

이용자의 특정 요구에 따라 결과를 생성해내는 인공지능을 말한다. 데이터 원본을 통한 학습으로 소설, 이미지, 비디오, 코딩, 시, 미술 등 다양한 콘텐츠 생성에 이용된다. 한국에서는 2022년 Novel AI의 그림 인공지능 등장으로 주목도가 높아졌으며, 해외에서는 미드저니, 챗GPT등 여러 모델을 잇달아 공개하면서 화제의 중심이 되었다.  

보통 딥러닝 인공지능은 학습 혹은 결과 출력 전 원본 자료를 배열 자료형 숫자 데이터로 변환하는 인코딩 과정이 중요한데, 생성 AI의 경우 인공지능의 출력 데이터를 역으로 그림, 글 등의 원하는 형태로 변환시켜주는 디코딩 과정 또한 필요하다.

 

 

 

 

구글 vs MS, 챗GPT 열풍에 AI챗봇 경쟁

미국 오픈AI의 대화형 인공지능 모델인 '챗GPT' 열풍으로 시작된 챗봇 개발 경쟁이 구글과 마이크로소프트(MS)로 옮겨붙고 있다. 구글이 글로벌 검색 시장에서 91%의 점유율을 차지하고 있는 가운데 오픈AI와 계약을 맺은 MS가 시장판도를 뒤집을 수 있을지 관심이 쏠리고 있다.

영국 일간지 가디언은 10일(현지시간) "제임스웹 우주 망원경을 만드는 데 100억달러(약 12조7050억원)가 들었지만 구글의 새로운 챗봇이 제임스웹에 대한 질문에 잘못 대답해 구글의 손실이 1630억달러(약 207조915억원)이상에 달한다"며 "구글과 MS의 경쟁이 새로운 국면에 접어들었다"고 보도했다.

구글은 지난 8일(현지시간) 프랑스 파리에서 생성형 AI를 결합한 검색서비스 '바드'를 공개했으나 틀린 답을 내놓았다. 구글 바드에게 "9살 아이에게 제임스웹 우주망원경의 새로운 발견에 대해 어떻게 설명해줄 수 있을까"라는 질문을 던졌는데 바드는 "제임스웹 우주망원경은 최초로 태양계 밖의 행성을 찍었다"고 잘못 답한 것이다. 태양계 밖 행성을 최초로 촬영한 망원경은 유럽남방천문대가 칠레 남부 고도 2635m 지점에 설치한 초거대 망원경 'VLT'이다. 

MS가 검색엔진 빙(Bing)에 챗GPT를 접목하기로 하자 구글이 설익은 챗봇을 내놓은 것으로 분석됐다. MS는 수십억달러(약 수조원)를 투자해 오픈AI가 개발한 챗GPT 기술로 빙 검색 엔진과 엣지(Edge) 웹 브라우저를 향상시킨다고 지난 7일(현지시간) 발표했다. 

MS는 "챗GPT를 기반으로 하는 이 기술은 관련성이 높은 최신 결과를 제공하며 쇼핑 또한 더 쉽게 하는 데 도움을 줄 것"이라고 밝혔다. 새로운 빙은 몇 주 후 공개적으로 사용할 수 있을 예정이다. 

필립 옥켄덴 MS 윈도우·검색 부문 최고재무책임자(CFO)는 “검색 광고 시장에서 점유율이 1% 포인트 증가할 때마다 20억달러(약 2조5410억원)의 수익 기회가 발생한다”고 말했다. MS가 챗GPT를 탑재한 빙으로 검색 시장 점유율을 높일 수 있을 것으로 기대한다는 의미다. 

그러나 MS는 여전히 넘어야 할 산이 많다. 구글은 여전히 강력한 위치에 있다. 인터넷데이터회사인 시밀라웹에 따르면 구글의 검색시장 점유율은 91%인데 MS 빙의 시장 점유율은 단 3%에 불과하다. 빙은 지난 2009년 출시된 뒤 단 한번도 구글의 검색시장 지배력에 영향을 미치지 못했다. 

챗GPT는 구글 바드와 데이터 학습 시점에도 차이가 있다. 챗GPT는 2021년까지 생성된 데이터만을 학습했지만 바드는 구글 검색의 최신 정보도 종합해 답을 제공한다.

구글은 AI에 투자도 많이 했다. 대표적인 게 구글 번역기다. 알파벳은 또한 영국에 본사를 둔 선도적인 AI 조사 회사 딥마인드를 소유하고 있다.

마크 리들 미국 조지아 공대교수는 "구글은 오픈AI와 동등한 대규모 언어 모델 기술을 보유하고 있어 새로운 버전의 빙이 구글 검색 비즈니스에 심각한 위협이 될 것이라고 생각하지 않는다"면서도 "MS는 검색 기술을 거의 하룻밤 사이에 다시 양강 구도로 만든 큰 위업을 완수했다"고 밝혔다.

 

잡스9급 PDF 교재

✽ 책 구매 없이 PDF 제공 가능
✽ adipoman@gmail.com 문의
 
유튜브 강의

 

반응형