흥미로운 영상 두 개 소개해드립니다.
아래 두 영상의 인공지능은 자전거 타는 법을 모르는 어린 아이가 시행착오를 겪으며 자전거 타는 법을 배우는 과정과 비슷합니다.
1. 입력되는 데이터는 화면에서 볼 수 있는 시각적인 자료입니다.
(아마 공의 위치, 바의 위치, 얻게 되는 점수 등)
2. 목표는 스크린상의 점수를 최대로 얻는 것입니다.
3. 알고리즘 상에는 공이 어떤 역할을 하는지, 바를 움직이면 무슨 일이 일어나는지 입력되어 있지 않습니다.
4. 10분 경과. 바를 움직여 공을 튕겨내려 하지만 잘 되지 않습니다.
(어쩌다 공을 쳐내 점수를 얻었던 상황에서의 데이터는 계수가 높아지며 강화됩니다)
5. 120분 경과. 전문가 수준에 도달합니다.
6. 240분 경과. 마법이 일어납니다.
인공지능은 한 곳을 파내는 것이 점수를 최대로 얻는 가장 나은 방법이라는 것을 깨닫습니다.
1. 처음에는 사람이 직접 로봇팔을 잡고 탁구를 칩니다.
2. 이 때 로봇팔의 데이터가 저장이 되어 어떻게 치는지를 배우게 됩니다.
3. 이후부터는 사람과 탁구를 치며 공을 쳐낼 경우 그 때의 로봇팔의 데이터는 강화됩니다.
4. 바둑이나 위의 게임과는 다르게 자체적인 시뮬레이션을 짧은 시간에 빠르게 수십, 수백만 번 할 수 없기에 짧은 시간에 실력이 크게 향상되는 않지만 점점 능숙해져 갑니다.

인스티즈앱