Анализ составления данных. Выводы 5 и 6.
- 26.02.23 г.
- 9772225665000    23007


А. В данной статье речь пойдет о специфической процедуре работы с данными, обусловленной их анализом и исследованием действий и операций с ними.
    Данные в диалектике рассматривается намного шире, чем в науках, что вызвано их более объемным пониманием и определением. При этом и их функционал понимается шире: их можно не только воспринимать, различать, собирать, кодировать, анализировать и т.п., но и осуществлять еще ряд действий, в целом не осуществляемых в науках и информационных технологиях. Однако это не значит, что если в науках нет корректного определения данных, то и информация об объектах не может фиксироваться и обрабатываться по-другому, чем принято в традиционном смысле. В частности, примером этого являются нейронные сети: ведь если отдельные процедуры обработки данных в них исполняются по однозначным и жестким алгоритмам, то некоторые их результирующие действия уже нельзя отнести к сфере результатов точных и однозначных вычислений. Соответствующего методологического парадокса ученые и разработчики нейронных сетей пока не видят, в том числе и по причине отсутствия корректного определения данных в науках. Но в диалектике такого рода парадоксальные ситуации были отмечены еще Платоном, причем именно в методологическом смысле. Этот феномен в науках еще будет исследоваться, как полагающий новые изыскания, а вот в диалектике он уже осознан как своего рода грань некоторого результата развития научного познания как общественного явления. В этом плане материалы о нейросетях на сайте будут размещены чуть позже, а пока достаточно лишь акцентировать, что они привнесли нечто новое в подачу и использование информации на основе однозначных алгоритмов и что это обусловливает пересмотр информатики и программирования...
    Итак, в диалектике большое значение придается такой деятельности, как анализ составления данных. Это не анализ в обычном смысле этого термина, это – специфическая процедура обработки данных после их сбора. В этом смысле можно сказать, что в прямом смысле этого словосочетания анализу составления данных в науках и информационных технологиях придается большое значение, однако, во-первых, он осуществляется преимущественно во внешнем и аналитическом плане. Во-вторых, науки и информационные технологии не исследуют сущностные аспекты данных – данные в их сущностном плане. В-третьих, данные исследуются на полноту, непротиворечивость и т.д., что необходимо для их (ограниченной) научной обработки, но это далеко не все аспекты понимания данных, или данные не исследуются полностью и как таковые. Это объяснимо: науки и информационные технологии, как уже неоднократно отмечалось на сайте, не имеют определения данных, поэтому могут анализировать и исправлять только их некоторые отдельные внешние аспекты, да и то частично – только в той или иной мере понятной ученым. Однако существенны и другие моменты (их полный перечень можно будет привести отдельно), но отдельно и особо мы сейчас акцентируем лишь диалектическое понятие характера данных. Это диалектическое понятие, связанное с имением вообще данных, которое отражает то, что кроме качества данных, которое необходимо обозначать при их определении, чего в науках и информационных технологиях до сих пор не сделано, необходимо акцентировать также и определения качества. Это изучено в диалектике, но именно об этом в науках вообще нет речи! – хотя эти параметры играют важнейшую роль при восприятии, фиксации, подготовке и обработке данных (это отдельный вопрос, напрочь упущенный в науках) и соответственно определяют ряд процедур, как онтологического, так и методологического плана. В диалектическом программировании они изучены и применяются, и одна из них как раз и акцентируется ниже. 

Б. Анализ составления данных – это диалектический инструмент, призванный определить качество данных, точнее – один из его параметров, причем в смысле не столько полноты, аномалий, конфликтов и т.п. данных, что изучается в науках, сколько именно возможности их эффективной обработки, их добротности («качества качества»). Все такого рода характеристики следует из понятия качества, подробно рассмотренного Гегелем, так что повторять слова великого философа нет смысла.
    Смысл фиксации и изучения добротности и эффективности обработки определений (данных) интуитивно ясен и без исследований Гегеля (однако без них этого сделать невозможно – в науках попросту нет соответствующих представлений и гносеологической базы) – это понимание природы данных, их свойств и операций с ними. Иными словами, ученым понятно, что при обработке признака (например, сведений столбца таблицы) использоваться должны подобные данные, в том числе данные соответствующей одной размерности: например, в графе «цвет» или «длина» не может быть значения «10 кг.», что не может быть отрицательного роста или веса человека и т.п. Это все понятно в рамках научного внешнего аналитического порядка исследований, но недостаточно в смысле диалектического понятия феномена и определения данных. Эту «разницу» необходимо, с одной стороны, осмыслить – для этого в современной диалектике создана соответствующая дисциплина и отдельные процедуры, а, с другой стороны, зафиксировать как следствие фиксации (получения) конкретных данных. Далее необходимо учесть ее существо и специфику при обработке данных и создании модели. Одной из ипостасей этой деятельности как раз и является анализ составления данных – выявление специфики данных и формирование их определения и образа в конкретном случае изучаемого объекта в целях осуществления дальнейших действий, в целом известных в науках и информационных технологиях и о которых уже была речь на сайте.
    Иными словами, требуются дополнительные действия при сборе и в процессе предобработки данных (которые были недавно рассмотрены), что является одной из причин расширения понятия данных.

В. Одними из задач, решаемых при сборе и в процессе предобработки данных на основе анализа составления данных (их полный перечень можно будет привести отдельно), являются а) выявление параметров ситуации, в которой они имеются (образуются), и аспектов ее влияния и б) исключение факторов потери данных (например, откидывание данных с пиковыми значениями).

Г. Одними из основных положений анализа сбора и составления данных являются уже неоднократно помянутые моменты и аспекты векторов формирования новых инструментов информационных технологий и порождения новых инструментов, обладающих характеристиками исследуемой предметной области (см. «Особенность исследований ИТ»). О них уже было достаточно сказано выше, поэтому их повторять не нужно.

Д. Основными измерениями (направлениями осуществления) анализа составления данных являются следующие.
    Категориальный анализ воспринятого. Это чуждый наукам анализ, поскольку он включает в себя анализ понятия данных, т.е. всецело базируется на философии Гегеля. Но в целом его смысл понятен: должна быть определена система понятий исследуемого предмета.
    Предметизация данных. Это также чуждый наукам анализ: хотя он противоположен по своему существу предыдущему, но также всецело базируется на философии Гегеля. Однако в целом его смысл также понятен: должно быть определено содержание предмета исследований.
    Правильность сбора данных. Это уже более понятное наукам положение, тем более что его можно понимать как дополнение к интуитивно принятым в науках положениям. Например, в науках и информационных технологиях в требованиях к сбору и формированию данных отсутствуют важные позиции, которые необходимо было дополнить, в том числе а) описание критериев и способа образования выборки, подлежащей обследованию, б) доказательство объема выборки, в) обоснование выбора принципов используемого формата (вида, распределения)  данных и т.д.
    Однородность данных в смысле стабильности (коэффициента) корреляции различных признаков по всей выборке. Это наиболее понятное для наук положение, причем достаточно очевидное, однако во всех встречавшихся нам теоретических описаниях обработки данных и в примерах, не учитывается главное: различие корреляции.

Е. Главным выводом является следующий: необходимо исследование характеристик и свойств данных, не учитываемых в науках и информационных технологиях.
    В Разделе было обозначено новое измерение (направление) подготовки данных, причем не обязательно осуществляемое на стадии их предобработки.
    Оно рассматривается с позиции концептуально-целевого значения в разных ракурсах. Укажем два из них.
    Ранее новое измерение (направление) подготовки данных было рассмотрено с точки зрения формального группового преобразования совокупности данных: исследование аспектов, черт, свойств и характеристик данных и их обработки, причем в соответствии с вопросами их классификации, группирования и обобщения и их собственной логикой и логикой развития и методологическими позициями наших исследований.
    Теперь оно рассматривается с точки зрения природы данных: анализ составления данных, в том числе определение качества полученных данных в смысле возможности их эффективной обработки.


[Продолжение: «Анализ инструментов исследований в смысле стабильности их применения».]

 

Дискуссии и конференции. Методы.