2024/08 21

[29일차] 부트 캠프 테크노트

지식 나눔 활동 일 데이터 라벨링 강의를 듣게 됐다. 유클리드소프트의 공동 대표님께서 강의 진행하시면서 회사 개요와 연혁부터 소개에 나섰다. 유클리드 소프트의  경영철학은 '지식의 통섭으로 누구나 행복한 가상세계를 창조하는 기업' 라고 하셨다.추구하는 가상세계는 마치 메타 버스가 연상되고 미래비전으로 나아가는 회사임을 알게 됐다.  강사님은 얼마전 샘알트만(오픈AI 대표)이 미래의  PC파워는 화폐가치를 가진다.고 언급했다 하셨다.파워 성능이 AI에 끼치는 영향을 생각해보면 AI시대에는 혹시라도 분기별 재무제표에 PC성능이 첨부돼야 한다는 의미가 아닐까 싶다. 유클리스드 소프트의 감시CCTV AI모델은 초기 모델의 투박함을 경량화와 정량화 시켜 좀 더 새롭게 변화 시켰다. 2년동안 노력을 들인 온디바이스..

카테고리 없음 2024.08.15

[28일차] 부트 캠프 테크 노트

인공지능 트랜스포머 오늘의 강의 시작 부분은 NLP의 정의 부터 맞이한다. NLP란 Natural Language Processing의 약자로 자연어 처리를 의미한다. 가령 이 기술이 우리 인간을 인공지능과 대화를 가능케할 수단을 의미하는 데교수님이 제공하신 강의집에서도 엔비디아 ceo인 젠슨황의 모습을 한 아바타와 인터뷰자들간의 대화를 진행하는 영상을 엿볼 수 있었다. 마치 이부분에서는 사람처럼 인공지능도 언어를 학습함을 엿볼수 있었는 데우선 언어의 이해와 언어의 생성이라 두 부분이 크게 와닿았다. 인공지능 또한 언어의 정보습득면에서 당연히 제로베이스에서 시작했을 테고, 천천히 데이터를 쌓아 올랐을 것이다.그러면서 인간처럼 지식 정보의 습득이 쌓일 수록 양질의 정보를 형성한다는 것인데아래 차트를 보면 ..

카테고리 없음 2024.08.13

[27일차] 부트 캠프 테크노트

인공지능 학습  새로운 교수님이 오셔서 인공지능 학습을 진행하는 날새롭게 바뀐 교수님 엔비디아 교육 엠버서더인 한국화학연구원 소속 강영묵 박사님이 강의를 준비해 주셨다. 엔비디아 교육 코드를 배포하여 GPU를 기반으로 진행하는 인공지능 교육을 받을 수 있게 해주셨고.이 프로그램은 회당  40만원의 매우 비싼 수업 강의였다.또한 수료증까지 받을 수 있다고 해 열심히 강의에 참여하도록 장려하는 그런 강의였다.  엔비디아 사측에서 제공하는 딥러닝의 기초 강좌여기에서 앞전의 배운 내용을 다시금 접하게 됐는 데 교수님의 예시 강의가 귀에 쏙쏙 담게 됐다. 앞선 테크노트에서 방정식 모델로 한번 언급한 수의 공식 모델이였다.Y= 결과값이고(종속변수)X= 독립변수m,b 기울기와 절편이였다.정말 이해가 쉽지 않았던 커널..

카테고리 없음 2024.08.11

[26일차] 부트 캠프 테크 노트

대망의 ai  조 미니 프로젝트 발표회  분리수거 길잡이를 주제로 잡고 진행한 우리 조는 꽤 순조롭게 진도를 나갔다. 전날에는 미리 데이터 이미지를 수집을 완료하는 단계까지 거쳤다. 이제 이 수집한 데이터를 학습 시키고 원하는 출력물을 밟아야한다.  차례로 설명해보면X(독립변수) 크롤링한 이미지데이터를 , Y(종속변수) 각 그림에 가져야할 값을 부여해주는 작업이다.수치적 변환이 이루어져야 AI가 학습이 가능하기에 XOR 분류를 통해 값을 할당해줬다. 그런 다음 이미지학습 함수를 잇달아 만들고 사이즈와 RGB 3개 변수, 그리고 이미지를 커널화 하여 3*3 사이즈로 2칸씩 읽게끔 유도를 해준다. 그후 레이어를 2층 만들어 뉴런 학습을 각각 128개와 32개로 할당해주고 마지막 결과값은 4가지가 나와야함으로..

카테고리 없음 2024.08.11

[25일차] 부트 캠프 테크 노트

인공지능 조별 프로젝트 시간이다.우리 조는 분리수거 분리배출에 관한 길잡이 프로젝트를 진행하기로 했다. 위 사진은 교육장 건물 내에 있는 커피집 테이크 아웃잔이다. 강의실에서 매우 흔하게 볼 수 있다.사진을 보면 캔류 쓰레기통에 잘못 들어가 있고 또한 잔과 종이 홀대를 분리해서 배출해야 하는 데 같이 버려져 있는 것을 볼 수 있다. 이렇게 우리가 흔히 놓치는 분리수거 수칙을 체감할 수 있었으며 이 점을 프로젝트화 하기로 했다.  우리 조 프로젝트를 간략화 해보면 가장 미흡하게 분리수거 품목 4가지를 선정하고 품목 별 크롤링 이미지를 학습 시킨 후 4가지 품목을 올바르게 인식하는 학습 모델을 구현하는 것이다. 그 후 완벽히 수행한다면 해당 물건들의 올바른 분리수거 방법을 띄워 유도하는 방안이다. 해당 코드..

카테고리 없음 2024.08.11

[24일차] 부트 캠프 테크노트

인공지능 학습오늘은 주식 시장에 관한 데이터 분석강의이다 한국의 대표적인 대기업 삼성의 증권 데이터를 2016~현재까지의 데이터를 가져 올 수 있다.시가, 고가, 저가, 종가, 거래량, 전일대비 등락률 (속성) 값들을 가져오며국내장 뿐만 아니라 해외장까지 가져올 수 있다.위는 미국 증시에 상장된 테슬라 데이터이다. 이 중 시가 가격으로 딥러닝 과정을 밟아 볼 생각이다.2016년부터 현재까지의 데이터라 1200여개의 수많은 데이터들이 주가의 성장에따라 폭 넓게 다른 가격으로 형성 되기 때문에  이 방대한 데이터를 정규화 과정을 거쳐 축소 시킬 필요가 있다.위 코드가 정규화 작업이다.그 방대한 데이터를 0과 1 사이 값으로 축소 시키는 것이다.이제 훈련 데이터와 테스트 데이터로 일정 부분으로 나눠 줄 것이다..

카테고리 없음 2024.08.11

[23일차] 부트 캠프 테크 노트

인공지능 학습 모델   파이썬 pandas에서 제공하는 인디언들의 당뇨질환 관련된 데이터 셋이다.우선 이런 데이터를 받게 되면 히트맵을 작성 해보자그럼 상관관계가 있는 변수들을 쉽게 집을 수 있을 것이다. 아래가 위 데이터셋의 히트맵이다. 각 변수의 상관관계를 색깔의 짙음으로 표현해주는 데  1에 가까울수록 상관관계가 높음을 의미한다.  예시로 당뇨와 임신의 상관관계는 0.22이고 당뇨와 나이는 0.24의 상관관계를 보여준다. 이를 토대로 해석하면 임신의 여부보다는 나이가 좀더 당뇨와 밀접한 관계를 알 수 있다.위에서 불러온 데이터셋은 수기로 작성한 숫자를 데이터이다.0~9까지의 숫자를 여러 수기 형태로 작성됐는 데 이를 픽셀값으로 하여금 표시를 했다. 흑백이미지 이므로 색이 부분을 값을 넣어줘 나름의 ..

카테고리 없음 2024.08.11

[22일차] 부트 캠프 테크 노트

22일차 인공지능 학습 딥러닝과정에 입문하기 시작했다.가장 먼저 신경망 개념 저번 강의를 통해 픽셀 인식하는 머신러닝의 구현은 쉽게 작용한 것을 알 수 있다. 하지만 색 혹은 동적 데이터를 인식하기에는 어렵기에 위 그림처럼 여러 레이어를 통해서 인식을 유도해야한다.퍼셉트론 = 인공 신경망 False ^ True = truetrue ^ true =  false perceptron = bias 값을 랜덤하게 넣어주는 기능 위 코드에서 XOR게이트만 올바른 출력이 안나오는 이유를 설명하는 자료이다.XOR게이트 문제 해소를 위해 신경망 하나를 더 연결하여 퍼셉트론 라인을 하나 더 생성하자는 해결법이렇게 다층 퍼셉트론이 가해진 것이 딥러닝이라고 불린다. 데이터의 학습은 은닉층에서 이루어지며 뉴런의 갯수를 설정할 ..

카테고리 없음 2024.08.03

[21일차] 부트 캠프 테크 노트

마지막 부트 캠프 esg 특강이다 오전 가장 먼저 이강산 작가님의 나는 나다 강연이 시작됐다. 이강산 작가님은 휴먼다큐 작가, 소설가, 시인, 사진작가등 여러 직업을 종사하시면서 청충들에게 ' 답게'라는 언어의 정의를 강조하며 포문을 여셨다. 저 많은 작품 활동들이 있지만 이번 강연에서는 여인숙 사진첩을 중심으로 강연 내용을 풀게 됐다.위는 작가님이 존경하시는 멘토작가들이다. 여기서 아니 에르노는 서점에서 추천도서로 노벨문학상을 수상한 작가라 눈에 익은 감이 있었다. 피사체와의 거리가 중요하다는 로버트 카파의 어록이다. 최고의 사진은 진실 그 자체. 작가님은 여인숙의 진실을 대중들에게 보여주기 위해 노력을 하시는 데 그의 진실에 다가가기 위한 노력과 수고에는 죽을 고비도 여럿 있다고 하셨다. 다음 강연자..

카테고리 없음 2024.08.03

[20일차] 부트 캠프 테크 노트

인공지능 3일차바로 예제 코드 부터 들어간다.IRIS 라이브러리에서 데이터셋를 가져와 예제코드를 진행해 본 것이다가져온 데이터의 개수는 150개이다 그중 8:2비율로 훈련데이터와 테스트 데이터로 나눠준것이다120개 데이터가 학습을 진행할 훈련데이터이고30개 데이터가 테스트를 해볼 데이터셋이다.선형회귀를 적용하여 예측분석으르 진행할 테고방금 나눈 훈련 데이터를 FIT함수를 이용하여 머신러닝을 적용시킬 것이다. 여기서 FRINT weight 와 bias는 기울기와 y절편으로 보면 될듯하다. regression.score 는 훈련데이터로 맞춰본 점수를 퍼센티지해서 보여준다.120개의 훈련데이터 중 92퍼선트로 맞췄다.꽤 좋은 정확도를 보여주기에 한번 테스트 데이터로 검증해볼것이다.독립변수 훈련데이터를 기반으로..

카테고리 없음 2024.08.03