Недавно увидела на Reddit интересную визуализацию: https://laion.inference.net/embeddings">карту связей научных статей, где десятки тысяч работ собраны в кластеры по предметным областям.
Как это сделано: из открытого набора LAION (около 100 млн научных и исследовательских текстов, здесь — небольшой срез) извлекли краткие выжимки, перевели статьи в векторные представления, спроецировали в 2D и сгруппировали по близости.
🔗 Демо: https://laion.inference.net/embeddings
🛠️ Код: https://github.com/context-labs/laion-data-explorer (React + D3)



