t-SNE 노드
t-SNE©(t-Distributed Stochastic Neighbor Embedding)는 고차원 데이터를 시각화하기 위한
도구입니다. 이는 데이터 점의 연관관계를 확률로 변환합니다. 원래 공간의
연관관계가 가우스 결합 확률에 의해 표현되고
임베드된 공간의 연관관계가 스튜던트 T-분산에 의해 표현됩니다. 이로 인해 t-SNE가
로컬 구조에 특히 민감할 수 있으며 기존 기술에 비해 몇 가지 기타 장점을 갖게 됩니다. 1
- 단일 맵의 많은 척도에서 구조 표시
- 다중, 이형, 매니폴드 또는 군집에 있는 데이터 표시
- 중심에서 함께 복잡한 포인트로 경향성 저하
SPSS® Modeler에서
t-SNE 노드는 Python으로 구현되며 scikit-learn© Python 라이브러리가 필요합니다. t-SNE 및
scikit-learn 라이브러리에 대한 세부사항은 다음을 참조하십시오.
노드 팔레트의 Python 탭은 이 노드와 다른 Python 노드로 구성됩니다. t-SNE 노드는 그래프 탭에서도 사용할 수 있습니다.
1 참조:
van der Maaten, L.J.P.; Hinton, G. "Visualizing High-Dimensional Data using t-SNE." Journal of Machine Learning Research. 9:2579-2605, 2008.
van der Maaten, L.J.P. "t-Distributed Stochastic Neighbor Embedding."
van der Maaten, L.J.P. "Accelerating t-SNE using Tree-Based Algorithms." Journal of Machine Learning Research. 15(Oct):3221-3245, 2014.