AI 3

AI 모델 훈련에 쓸 데이터가 없어지고 있다

MIT가 주도하는 연구 그룹인 데이터 프로방스 이니셔티브(Data Provenance Initiative)에 따르면 지난 1년 동안 AI 모델 학습에 사용되는 가장 중요한 웹 소스들 중 상당수가 데이터 사용을 제한하고 있는  것으로 나타났다. 뉴욕타임스 보도에 따르면 데이터 프로방스 이니셔티브는 널리 쓰이는 3가지 AI 학습 데이터셋이 포함된 1만4000개 웹 도메인들을 조사했고 퍼블리셔들과 온라인 플랫폼들이 데이터 수집을 막는 조치를 취함에 따라 동의와 관련해 새로운 위기(emerging crisis in consent)가  발생하고 있다는 점을 밝혔다.  AI 훈련에 데이터를 사용하지 못하도록 하는 제한 조치들이 여기저기에서 취해지고 있다는 얘기였다. 데이터 프로방스 이니셔티브 연구원들은 연구AI 훈..

NEWS/IT news 2024.07.23

AI 란 무엇인가?

Artificial Intelligence. 인공지능. 통계학 단일 학과만을 4년 동안(휴학을 좀 많이했는데요) 배운 후, 회사에 입사해서 통계 모델을 만들고, 수치형 데이터 분석을 계속해 온 나에게 인공지능은 가깝지만 멀었다. 애초에 회사에 데이터 사이언티스트와 머신러닝 엔지니어 직군이 따로 있었고, 나는 전자에 속했기 때문에, '인공지능 / 머신러닝' 에 대해서 공부할 필요가 (당장은) 없다고 생각했다. 그런데 DS 쪽을 계속 공부하면 전처리(라 쓰고 노가다라고 읽는)와 인사이트 발굴을 하면서 '통계모델'의 한계를 느꼈다. 비단 모델의 한계뿐 만 아니라도, 데이터를 더 발전된 머신러닝 더 나아가, 딥러닝모델에 적용해보면 어떤 결과가 나올지 궁금해졌다. 홀린듯이 머신러닝/딥러닝 관련 인강을 듣기로 했다..