естественный интеллект (NI)

Практически каждая книга (кроме учебной литературы), которую пытаешься отнести к какому-либо разделу, сопротивляется этому. Когда-то давным-давно, когда я только начинал каталогизировать и дело двигалось еле-еле, постоянно роились мысли как бы это дело ускорить и автоматизировать. Например, каждая книга имеет коды ББК и УДК. Это отечественная и международная системы классификации книг. Соответственно, первым делом приходит мысль – ха, да я сейчас раскидаю все моментом. А вот и нет-с, счаз, размечтался… Мало того, что у них разное наименование разделов (преодолимо mapping-ом к структуре КТК разделов сайта), так еще большинство кодов очень и очень примерны или совсем “от балды”, то есть практически бесполезны.

В примере выше расшифровщики выдают:

УДК – Русская литература Криминальные романы Полицейские романы Детективные романы Триллеры. ББК – Произведения русской литературы ХХ в. (1917 – ) кусок -44 не удалось определить. Т.е. общее у них то, что это русская литература.

За прошедший год очень заинтересовался AI (искусственным интеллектом). Очень примерные сейчас наработки, но очень надеюсь, что в будущем смогу сформулировать и составить набор правил, которые позволят обучить AI и применить его в деле.
А пока…

К примеру, возьмем книгу Хохот шамана Владимира Серкина.

https://www.knigosvet.com/detail.php?id=432420

С одной стороны это дневниковые записи, что направляет книгу в раздел Письма Дневники Записные книжки Эссе, но с другой стороны шаманизм, это Эзотерические системы Толкования Культы Духовные практики. Это как весы что в руках у Фемиды. Куда перетягивает, туда и относим. И зачастую бывает так, что веса равны, возможных разделов три или даже четыре, тогда определиться еще сложнее. На помощь приходит еще один критерий. Я называю его “по содержимому”. Немного отрешившись от “весов”, смотрю книгу “вообще”. И весы начинают показывать…