Machine learning 중에서도 classification이 현실에서 제품을 만들어 내는 과정에 어떻게 중요한지를

나름대로의 생각으로 메모해 둔다.

1. Doamin expert

- 그 분야의 전문가가 필요한 것은 당연하다. machine learning의 전문가가 아닌 해당 문서영역의 전문가가 필요하다는 것이다.

이런 전문가들은 Feature selection, Feature discovery등의 여러가지에 사항에 중요하고 큰 결정을 자신의 경험을 토대로 반영해야 하고(확신을 가지거나 또는 직감적으로 그러한 행위를 해야 하고) 그로 인해 결과가 많이 달라질 수 있다.
문제의 시작은 이 사람이 잘하느냐 안하느냐 보다는 그 사람을 domain expert로 인정할 것인가 아닌가를 결정하는데서 부터 시작한다.

2. Judgement

- 많은 대상 문서를 가지고 있고 좋은 feature를 추출하였다고 하더라도 judgement가 일관성이 없고 체계가 없다면 주기적으로 학습을 반복하는데 문제가 발생할 수도 있고 학습 단계부터 최공 결과물 단계까지의 신뢰성을 확보하는 것이 아예 불가능하다.
마지막 delivery에 대한 품질을 평가하는 것도 가장 확실한 방법은 인간이 판별하고 그 결과를 보편화해서 받아 들이는 것이다.(위험하긴 하지만..그나마..)

3. Software

- Machine learning 분야에서 의외로 우선순위가 떨어지는 것이 software이다.

이것은 잘되어 있는 소프트웨어가 이미 많이 나와 있고 기존의 오픈된 알고리즘을 이용하여 구현하는 구현단계가 이미 일반화되어 있음을 의미한다.

특정 프로젝트를 위해서 최적화 된 소프트웨어를 직접 제작해서 사용하는 경우도 많고 machine learning에 대한 학습이 되어 있는 엔지니어라면 그다지 어렵지 않게 할 수 있다고 한다.

4. decision

- Machine learning에 대한 결과물은 현재의 품질이 향 후에도 계속 지속될 것인지 또 real world에서도 실제로 효과가 있는지는 직접 해 보는 시행착오를 하지 않고서는 알 수 없는 경우가 많다. 결국 이와 같은 프로젝트의 결과물을 어느 정도 선에서 위험부담을 안고 서비스에 론치할 것인지를 결정하는 결정력도 당연 필요하다.