Кластеризация и классификация.
(Общее категориальное рассмотрение кластеризации и классификации и обозначение их различия как основы их рассмотрения в диалектике.)
- 24.09.23 г.
- 9772225665000     23021


Как обычно отмечается в научной литературе, кластеризация очень похожа на классификацию: в обеих происходит разделение исходной выборки на группы.
    Однако, во-первых, разделения различны, хотя ряд позиций во многом совпадает.
    При этом, во-вторых, их понимания различны в науках и диалектике.
    Кроме того, что особенно важно, в-третьих, их соответственные понимания, разные в науках и в диалектике, также различны, и чему следует уделить особое внимание при выявлении концептуальных позиций диалектического подхода к кластеризации и для ее определения в диалектике.
    В целом же в диалектике различение кластеризации и классификации в указанных смыслах имеет также и методологическое значение.
    В итоге через различие и обозначающееся тождество определяются не только до сих пор не выявленные в науках суть кластеризации, ее особенность и ее свойства, но и позиции более широких возможностей ее применения (см. следующую статью), а также методологических положений, важных для анализа других процедур познания.

Если имеется начальная неопределенность параметров выборки и на основе некоторых признаков осуществляется поиск наиболее похожих объектов (их однородных групп), то соответствующую операцию называют кластеризация. При этом за счет группировки похожих объектов со схожими параметрами определяется признак кластеризации: объект описывается набором характеристик, называемых признаками, и происходит разбиение схожих объектов на группы. Поэтому кластеризация в науках понимается как метод обучения без учителя.
    При кластеризации необходимо обеспечить максимальную схожесть объектов внутри каждого кластера, при этом число кластеров следует минимизировать. (Однако базовое понятие – «кластер» – неоднозначно, и во многом именно поэтому при кластеризации нет гарантий получения истинного или хотя бы оптимального разбиения на кластеры, о чем уже говорилось на сайте, и нет общепринятой классификации методов кластеризации).
    Для настоящей статьи принципиально важно то, что в науках при изучении и осуществлении кластеризации не производится отдельного анализа возможностей выявления
– нетипичных объектов или признаков,
– новых дополняющих признаков,
– структур данных,
– паттернов в совокупности данных,
– аномалий,
– типологии процедур обработки данных,
– гипотез формирования и исследования данных.
    Как считается в науках, кластеризация является логическим продолжением или даже обобщенным видом классификации в том случае (понимании), когда набор групп, классов, заранее не известен.

Если заранее известен некий признак (предопределенный параметр), по которому необходимо группировать объекты, то соответствующую операцию называют классификацией. Иными словами, при классификации параметры групп, классов предопределены. Поэтому классификация считается методом обучения с учителем, осуществляемом в соответствии с обучающим набором. Классификация применяется, когда следует распознать объект по конкретному признаку и дать его описание.

В целом можно акцентировать следующие основные отличия классификации и кластеризации, рассматриваемые в науках:
– при классификации критерии группирования известны априори, а при кластеризации имеется начальная неопределенность параметров распределения,
– критерии классификации заранее предопределяются человеком, а кластеризации – алгоритмически при получении и обработке данных,
– классификацию и кластеризацию ассоциируют соответственно с методами обучения с учителем и без него.

В диалектике же учитывается, что классификация и кластеризация различны также и в смысле своих недостатков, что принципиально важно для комплексного понимания этих процедур, но в науках это вообще не учитывается.
    В первую очередь, в науках не выявлен ряд фундаментальных свойств как классификации, так и кластеризации: говорится лишь о признаках, но их определения применимы ко многим процедурам анализа.
    Во-вторых, имеются различные варианты разбиения данных в зависимости от применения разных методик (причем кроме классификации и кластеризации), поэтому могут реализовываться различные виды группирований и получаться разные результаты даже для одних и тех же данных.
    В-третьих, актуально такое сопоставление негативов классификации и кластеризации:
– классификация субъективна, что влияет на существо и исполнение многих методов (особенно, когда их разрабатывают одни люди, а применяют в конкретных случаях другие) и поэтому относительна,
– кластеризация неоднозначна в смыслах как алгоритмов осуществления, так и результата.
    В-четвертых, главными недостатками как классификации, так и кластеризации является то, что на основе научных подходов нет гарантий получения истинного или хотя бы оптимального разбиения на группы, кластеры (это обусловлено тем, что в науках не выявлен ряд фундаментальных свойств и классификации и кластеризации).

Перечисленные выше положения (и другие) стали основополагающими для диалектики – как для концептуального сравнения кластеризации и классификации, так и для нового изучения их в ней, в том числе для определения различия идей кластеризации и классификации и нового определения этих процедур и возможностей их алгоритмической реализации (эти положения могут быть обсуждены отдельно в дискуссиях).
    В целом на основе сказанного, в основном из концептуального сравнения кластеризации и классификации, определяются два базовых положения (принципа) для нового рассмотрения кластеризации (они также могут быть обсуждены отдельно в дискуссиях), имеющего два установленных аспекта.
    При этом если классификация в диалектике во избежание ошибок, характерных для наук, рассматривается в смысле Платона, что уже позволило решить ряд проблем, возникших с ней в науках, о чем уже говорилось на сайте, то вот кластеризацию пришлось переосмыслить практически полностью (за исключением общепринятых внешних по своей сути организационных норм, ставших своего рода регламентами, позволившими сочетать алгоритмическое исполнение кластеризации в диалектике и в науках).

 

 

Дискуссии и конференции. Методы.