연일 AI 관련 소식이 들려오는 요즘입니다. 특히 AI 기술을 기반으로 한 언어나 이미지 생성형 서비스들이 많은 사용자들을 모으고 있습니다. 하지만 요즘은 "나도 한 번 나만을 위한 AI 서비스를 개발해보는 건 어떨까?" 하는 생각을 하게 됩니다.
어쩌면 가까운 미래에는 인공지능에 대한 기본 이해와 더불어, AI 서비스를 나에게 최적화할 수 있는 약간의 개발자적 소양을 갖추는 것이 인재의 중요한 역량으로 평가 받을 수도 있습니다. 지금 MS Office 프로그램을 다루는 실력을 기업에서 기본적으로 요구하는 것처럼 될지도 모를 일입니다.
이번 글에서는 AI 개발에 대한 기본적인 이해와 AI 개발을 위한 기초 개발 환경을 설정하는 내용을 담아보려 합니다.
AI 개발이란 무엇일까요?
AI 개발이란 데이터를 기반으로 AI 알고리즘을 적용하여 원하는 정보를 얻어내는 일련의 과정을 말합니다. 주로 머신 러닝 및 딥 러닝 기술을 활용하여, 대규모 데이터셋에서 패턴을 학습하고 예측 모델을 만들어냅니다. AI 개발은 컴퓨터의 계산 자원을 이용하여 대용량 데이터로부터 빠르게 정보를 획득하여 학습, 문제 해결, 패턴 인식 등의 인간의 지능과 흡사한 인지 문제 해결을 목표로 합니다.
AI 개발을 위한 협업 영역
AI 개발은 크게 아래 4가지 영역이 함께 참여하면서 협업의 과정을 가집니다.
- Front-end 개발
- 사용자 화면으로, 사용자의 데이터를 입력 받거나 결과값을 수신 받음
- 사용자의 사용성을 높이는 것이 중요
- Tools : Google Kubeflow, AWS Sagemaker
- Back-end 개발
- Front-end와 연동하여 데이터를 Database에서 검색하거나 저장 및 삭제함
CRUD - Create, Read, Update, Delete - 사용자의 요청을 API형태로 받아, AI 모델 수행 결과를 처리(저장, 읽기, 삭제)
- Front-end와 연동하여 데이터를 Database에서 검색하거나 저장 및 삭제함
- Storage 및 DBMS 구축
- 학습 데이터 저장소 역할 (정형 및 비정형 데이터 모두 수용)
- AI 수행 결과 및 메타 데이터 저장을 위한 DBMS (정형 데이터 수용)
- AI 모델 개발
- 사용자 인터페이스상에서 AI 모델 개발
- 학습 데이터 저장소 및 Front-end와 유기적으로 동작
- 모델 개발을 위해 반복 수행하며 최적의 분석 모델을 찾기 위해 분석 결과는 DBMS에 저장됨
- AI 모델 개발의 예시
- 코드 기반 AI 모델 개발의 예시 : AWS Sagemaker
- Drag & Drop 기반 AI 모델 개발의 예시 : Azure designer
- AutoML 기반 AI 모델 개발의 예시 : Google Vertex AI
핵심은 DATA야!
최근 AI 관련 연구가 활발히 진행될 수 있는 것에는 우리가 발달된 기술력을 가지고 사람과 환경, 사회가 만들어내는 방대한 데이터를 수집하고 처리할 수 있게 된 상황에 이유가 있습니다. AI는 데이터라는 기반 위에 서있다고 할 수 있을 정도로, 데이터의 중요성은 강조해도 지나치지 않습니다.
AI 개발을 위해서는 AI 분야의 핵심이라고 말할 수 있는 데이터에 대한 기본적인 이해가 필요합니다.
데이터의 종류
- 정형 데이터
- 행과 열을 갖는 표준 데이터 베이스와 같이 관계형 스키마로 구성된 데이터
- 간단한 질의문을 통해 원하는 정보를 획득
- 예시 : 데이터 베이스, 스프레드 시트 등
- 반정형 데이터
- 고정된 스키마를 갖지 않는 정형 데이터
- 데이터에 레코드 및 필드와 같은 구조를 갖기 위해 태그나 인덱스 등을 포함
- 예시 : 시스템 로그, XML, HTML 등
- 비정형 데이터
- 구조화 되지 않은 임의의 형식을 가진 데이터
- 예시 : 이미지, 동영상, 문서 등
AI 개발 환경 세팅하기
Python은 문법이 간단하면서도 강력한 개발 도구로, AI 개발에 이상적인 개발 언어라고 할 수 있습니다. 파이썬을 사용해서 AI 개발을 위해서는 변수나 함수에 대한 이해나 제어문에 대한 학습이 필요하겠지만, 그리 어렵지는 않을 것입니다.
이번 글에서는 파이썬을 설치하고 사용하기위한 환경을 세팅하는 단계까지 같이 해보면 좋겠습니다.
Python 설치
- 파이썬을 설치하기 위해 파이썬 공식 사이트로 이동합니다.
https://www.python.org/downloads/windows/ - 각자 사용하는 컴퓨터 OS 환경에 맞는 파이썬을 설치합니다.
저의 경우 OS로 Windows를 사용하기 때문에 아래 화면 캡쳐에서 보이는 Python 3.11.8 을 다운로드 받았습니다. - 다운로드 받은 파일을 실행하여 기본적인 설정으로 설치를 진행하면 됩니다.
VScode 설치
파이썬을 개발하는 툴을 다운받아야 합니다. 파이썬은 메모장으로도 개발할 수 있지만, 개발자에게 더 편리한 기능들을 제공하는 개발 툴들이 있습니다. 그 중에 많은 개발자들이 실제 업무에서도 많이 사용하는 Visual Studio Code를 설치해보겠습니다.
- VScode를 설치하기 위해 Visual Studio Code 공식 사이트로 이동합니다.
- 각자 사용하는 컴퓨터 OS 환경에 맞는 것으로 다운로드 합니다.
- 다운로드 받은 파일을 실행하여 기본 설정으로 설치를 진행합니다.
VScode Extension 설치
파이썬을 개발할 때 파이썬 코드의 문법적인 오류를 자동으로 체크해주는 것과 같은 확장된 사용자 편의 기능을 제공하는 플러그인 설치하는 것이 좋습니다.
- 설치가 완료된 VSCode를 실행합니다.
- 실행된 VSCode 화면에서 왼쪽 메뉴 아이콘들 중에서 다섯 번째, 'EXTENTIONS'를 클릭합니다.
- 검색 창에 'python'을 검색해서 Python Extention Pack을 설치합니다. (Install 버튼 클릭)
이번 글에서는 AI 개발을 위해 AI 개발이란 무엇인지, 그리고 AI 개발을 위한 데이터에 대한 이해를 위한 내용을 다루어 보았습니다. 그리고 AI 개발을 위한 기초 개발 환경을 만들었습니다.
파이썬과 VScode 설치 과정에서 문의사항이 있으면 댓글을 남겨주시면 도움 드릴 수 있도록 하겠습니다. 그러니 어렵다고 생각하지 마시고 일단 위 안내를 따라서 한 번 AI 개발을 위한 첫 실행을 해보시길 바랍니다.