BigQuery로 최근접 이웃 구하기

BigQuery로 Consine similarity를 계산해서 최근접 이웃을 계산하는 예제 코드입니다.

Cosine Distance함수는 BigQuery에서 빠른 것을 제공을 해주기 때문에 따로 만들지 않고 제공하는 것을 그냥 쓰면 됩니다.

하지만 결국 BigQuery를 쓴다 해도 cross join을 해야합니다.

빅쿼리도 데이터가 조금만 커도 cross join은 실행되지 않습니다.

그래서 실용성이 있다고 보기는 어렵습니다.

작은 데이터에 대해서만 가능하기 때문에 그 점을 참고하시기 바랍니다.

Author: euriion

답글 남기기