(Анализ классификации методов ИТ.)
Концептуальный анализ классификации методов информационных технологий и ряда их позиций с некоторыми выводами по поводу новых информационных технологий.
(Тема будет развита в статье «Сетевая классификация методов» и ряде других).
- 25.09.22 г.
- 9772225665000 22023
В прошлой статье («Общие положения исследований методов») были критически рассмотрены некоторые аспекты обработки данных, а в настоящей будет осуществлен краткий критический обзор подразделений научной классификации методов информационных технологий, который позволил в диалектическом программировании обнаружить некоторые важные различения методов и принципы построения информационных технологий. Без понимания основ классификации методов, – фактически, сути методов – их корректное целевое применение невозможно. Для понимания сказанного необходимо ознакомиться с имеющейся в науках и информационных технологиях классификацией методов, точнее – с ее строением (в современной диалектике в связи с выявленным новым подходом к пониманию и формированию информационных технологий их методы классифицируются по-иному, об этом речь пойдет позже).
А. Как утверждается специалистами, методы информационных технологий можно классифицировать по-разному.
Во-первых, можно классифицировать по принципу работы с данными. В этом случае обычно акцентируются данные и в отношении них выделяются следующие две классификационные группы.
Первая группа определяется через данные, которые собираются, хранятся и используются непосредственно. Для этого используются базы данных. Это актуально при реализации кластерного анализа, метода ближайшего соседа, метода k-ближайшего соседа, рассуждений по аналогии и ряда других инструментов. Но такие методы низко производительны при работе с большими данными.
Вторая группа определяется через обработанные данные, которые получаются из начальных данных: они извлекаются, преобразуются в определенный (предзаданный) вид (шаблон), систематизируются и используются. Эта группа методов характеризуется целевой (субъективной) предустановкой, но обычно говорится, что свободным поиском (который не применяется при реализации методов первой группы). Такой подход применяется при реализации а) логических построений, или логической аналитики (например, нечеткие запросы и анализы, символьные правила, деревья решений, генетические алгоритмы), б) визуализации, в) кросс-табуляционных инструментов (например, байесовские сети и кросс-таблицы) и г) при решении уравнений (например, статистические методы и нейронные сети). Начальные данные и получаемые результаты имеют меньший объем, чем данные согласно предыдущему подходу (за счет предопределенного объема или характера обработки), и большую понятность (наглядность), а также могут более эффективно использоваться. Однако используемые методы имеют определенную специфику и ограничения (например, методы на основе уравнений могут работать лишь с численными переменными, что ограничивает их применение), а получаемые результаты в ряде случаев могут не иметь даже общих и абстрактных трактовок.
Во-вторых, методы информационных технологий можно классифицировать по принципам применения математических инструментов.
При использовании статистических методов осуществляется предварительный анализ статистических данных, выявляются их связи и закономерности, осуществляется их многомерный анализ, строятся динамические модели, прогнозы и т.п.
Кибернетические методы используют математические инструменты и технологии искусственного интеллекта.
В-третьих, методы информационных технологий можно классифицировать по задачам (см., напр.: «Основные задачи и позиции»).
В соответствии с таким подходом можно выделить, по меньшей мере, две группы.
Первая из них – это подразделение методов по задачам сегментации (т.е. задачи классификации и кластеризации).
Вторая – это подразделение методов в смысле получения описательных результатов и прогнозов.
В-четвертых, классификация методов информационных технологий актуальна и по основополагающим для методов и исследований информационных технологий математическим инструментам, начиная с видов анализа: дисперсионный анализ, корреляционный анализ, регрессионный анализ, кластерный анализ, факторный анализ и др. (Они будут обсуждены позже.) При этом каждому из них также присущи свои виды классификации. Например, методы кластерного анализа подразделяются по используемым подходам: вероятностный подход, логический подход, графовые алгоритмы, иерархический подход и др. А основными видами факторного анализа, рассматриваемыми обычно в их оппозициях, являются следующие: детерминированный и стохастический, дедуктивный и индуктивный, статический и динамический, ретроспективный и перспективный, одноступенчатый и многоступенчатый.
Актуальна классификация и в соответствии с отдельными математическими инструментами, разработанными специально для изучения конкретных предметов и характеристик рассматриваемых процессов (например метод Монте-Карло).
В-пятых, считается, что методы информационных технологий также можно классифицировать в смысле возможностей прогнозирования, имеющего отчетливо выраженные классификационные признаки: а) разделение на методы и модели, б) классификация методов по степени формализации, по характеру прогностического процесса, по способу получения и обработки информационных данных, в) эвристические возможности прогнозирования и др.
Иных общепризнанных классификаций информационных технологий нет (о некоторых диалектических классификациях будет сказано позже)…
По итогам краткого обзора отметим, что имеется несколько несущественных раздробленных видов научной классификации методов информационных технологий, что связано не столько с их большим количеством, сколько с желанием специалистов применить методы к чему только можно, лишь бы методы «подходили» к данным, что в свою очередь обусловлено желанием повысить как эффективность, так и коммерческую привлекательность информационных технологий, хотя достигается, скорее, обратный эффект: появляется понимание безразличности методов к данным, что вызывает законные вопросы об эффективности и надежности информационных технологий, о чем уже был разговор на сайте. При этом вопросы чаще всего возникают именно в смысле методов. А в связи с отсутствием ответов на них возникают проблемы, в том числе методологического плана (также см. ниже), как раз и приводящие к выявлению негативов, в том числе упоминаемых ниже, осмысление и исключение которых оказалось достаточно важным для современной диалектики при формировании концепта новых информационных технологий.
Б. В смысле обсуждаемой классификации интересно различение программных инструментов (их классификации нет), применяемых в информационных технологиях, что показательно на примере перечня групп наиболее известных из них:
– аналитические системы анализа данных широкого спектра (напр., Poly Analyst, Intelligent Miner, Interprise Miner, Mine Set и др.),
– нейросетевые системы (напр.: BrainMaker, NeuroShell, OWL),
– предметно-ориентированные аналитические системы решения специализированных задач (напр.: MetaStock, SuperCharts, Candlestick Forecaster и др.),
– статистические пакеты (напр.: SAS, SPSS, Statgraphics, STATISTICA и др.),
– пакеты, реализующие алгоритмы «деревья решений» (напр.: С5.0, Clementine, SIPINA, IDIS, KnowledgeSeeker и др.).
Но кроме указанных, обычно обсуждаемых групп (специализаций) также отдельным образом подлежат анализу следующие совокупности, отражающие определенные особенности обработки данных:
– подходы, предназначенные для управления базами данных, которые подразделяются на используемые в традиционных реляционных СУБД с доступом к данным средствами языка SQL, и альтернативные им (NoSQL),
– программы обработки больших данных (напр., MapReduce, Aerospike, Redis, Kafka, Spotify, Spark, Storm, инфраструктура Apache Hadoop и др.),
– витрины данных (напр.: Tableu, Qlick View, Power BI Desktop),
– методы систем поддержки принятия решений (напр.: метод рандомизации сводных показателей, метод анализа иерархий, метод аналитических сетей, метод доказательных рассуждений и др.).
– программные платформы (напр.: Oracle Data Mining, SAP Business Objects Predictive Analysis, SAP Predictive Maintenance and Service, IBM Predictive Insights, KNIME, Orange, Rapid Miner и др.).
Актуально рассмотрение и узкоспециализированных программных продуктов (напр., WizWhy (реализация алгоритмов ограниченного перебора), GeneHunter (генетические алгоритмы) и др.).
В. Некоторые выводы.
Указанные выше виды разделения и классификации инструментов (методов, подходов) информационных технологий, их принципы и недостатки будут более подробно обсуждены в дискуссиях (см. Дискуссии и конференции. Методы.), однако уже сейчас можно сделать выводы, необходимые и достаточные для настоящей статьи (и для развития исследований). Эти выводы целесообразно сгруппировать по тем или иным известным из диалектики признакам, что может послужить выяснению ряда обстоятельств и эмерджентных свойств информационных технологий (их перечень может быть обсужден отдельно), упущенных в науках, а в диалектике образующих ряд направлений исследований.
Приведем одну, наиболее наглядную и поэтому понятную группу выводов и замечаний, возникающих после анализа научной классификации методов информационных технологий.
В1. Некоторые выводы о научной классификации методов информационных технологий.
Во-первых, в науках и информационных технологиях классификации подверглись во многом неопределенные в своей сути и в своем применении положения (методы), так как в информационных технологиях не только не учитывается понимание (определение) методов (его нет), но и нет обоснования ряда их предметных и методологических аспектов (положений), существенных при их применении (их перечень может быть приведен и обсужден отдельно).
Также используемые в информационных технологиях методы не имеют концептуального обоснования – они определяются из некой внешней формы или на основе внешнего обстоятельства (например, задачи).
Указанное ставит под сомнение рассмотренную научную классификацию методов информационных технологий.
Во-вторых, так как инструменты информационных технологий являются в основном отвлеченными (от предмета исследований, внешними ему) и абстрактными, причем создаваемыми и используемыми только исходя из не обосновываемых логически мнений исследователей и разработчиков, к тому же еще и в условиях разнокачественных предметов и задач, то научная классификация методов информационных технологий не может быть однозначной, причем в смысле даже не основания классификации (это – отдельный вопрос), а объекта классификации.
В-третьих, обычно при описании методов информационных технологий и их классификации почти не упоминаются методы сбора и предобработки данных, что удивительно. Вообще об этих этапах говорят много, акцентируется их важность, обсуждаются разнообразные положения и т.п. Но как только разговор в науках начинается о классификации методов информационных технологий, то речь идет только об обработке данных и о поиске скрытых знаний. И это не случайность: дело в том, что методы сбора и предобработки данных недооценены гносеологически, и это, кстати, одна из причин недопонимания сути данных и соответственно их некорректного определения в науках и информационных технологиях…
В-четвертых, в научной классификации методов информационных технологий отсутствует анализ (обоснование) ее методологических оснований и возможностей, причем даже в их отдельных подразделениях (совокупностях).
По сути, в основу научной классификации методов информационных технологий положены разрозненные случайные положения, которые а) стали некогда очевидны при формализации методов, применяемых, исходя из эмпирических соображений, но не при осмыслении потребностей обработки данных, и б) не были достаточно изучены и систематизированы.
Таким образом, необходимо акцентировать не столько даже сопоставление инструментов информационных технологий, хотя оно должно было бы привести к системному рассмотрению методов, сколько факт всего лишь описания отдельных совокупностей методов, не имеющих общего основания или методологии их выбора, – описания, созданного по признаку решаемых задач или даже попросту формально, т.е. не учитывая их существа. Иными словами, известные методы обработки данных классифицируются, исходя не из их содержания (возможностей) и применительно к конкретному предмету, а из случайного по своей сути группирования в связи с субъективно формируемыми задачами или неких субъективных установок.
В целом информационные технологии в методологическом смысле нельзя считать научно обоснованными.
В-пятых, не обозначены (отсутствуют) методология выбора и анализ применения методов.
Иными словами, так как в науках и информационных технологиях нет четкого и однозначного понимания сфер и возможностей применения методов, то поэтому нет и принципа разделения методов, т.е. классификации (что отчасти объяснимо их абстрактностью и эмпирикой подхода к ним в науках).
Сказанное обусловливает выводы как об отсутствии единой классификации методологических возможностей в сфере информационных технологий, так и о несистемности применения методов.
В-шестых, такой фактор, как логика, не учитывается при научной классификации методов информационных технологий, при рассмотрении их реализации и самих информационных технологий. Наиболее наглядным в данном случае является игнорирование в информационных технологиях того, что метод не может не содержать суждения, а по-хорошему – умозаключения. Но суждения не определены в науках (см. «Рассудочного суждения в науках несостоятельность»), поэтому и не учитываются при определении методов в информационных технологиях и, соответственно, при их классификации.
Классификация методов информационных технологий нелогична!..
В-седьмых, все указанные выше позиции тесно связаны с еще одним недостатком научной классификации методов информационных технологий – с ее субъективностью. Про субъективность понимания и определения данных и обработки информации сказано было уже достаточно, так что субъективность научной классификации методов информационных технологий в целом понятна. Но сейчас важно то, что при ее анализе выясняется обстоятельство, ранее нигде не обсуждавшееся, однако предельно важное для понимания методов информационных технологий и их самих (в диалектике оно используется при формировании принципов новых информационных технологий): в информационных технологиях существенны еще и гуманитарно-субъективные положения, выявленные в современной диалектике (и определяющие в ней отдельное направление исследований).
Первым аспектом является психологический. И дело даже не в том, что каждый человек имеет свое собственное представление обо всем. Вопрос в том, что нет основ, позволяющих обосновать и выбрать даже вид или формат описания объекта, сбора данных, подход к нему, не то, что его алгоритм. Тут все дело в том, что психология, изобилуя множеством представлений, не является цельной наукой: в ней имеется несколько качественно различных парадигм («Несовершенство психологии»), и в зависимости от того, какая удобна для конкретного специалиста, та и выбирается, по сути, случайным образом. Поэтому не может быть объективного описания объекта, т.е. сбора данных.
Понятие сбора данных не может быть существенно уточнено и за счет обобщения – за счет социологических подходов. В этом случае имеется аналогичная проблема: социология также имеет несколько парадигм, не сводящихся друг к другу: структурный функционализм (Конт), «понимающая социология» (Вебер), Марксистская парадигма и др. Кроме того, социология субъективна.
Можно еще более обобщить рассмотрение: можно рассматривать некий общий феномен, опосредованно соотносимый с человеком, с людьми, с обществом. Это – законы развития общества. В этом случае уже можно акцентировать некоторые закономерности, изучаемые рядом наук: социальной философией, экономической наукой, политической экономией. При этом если гуманитарные аспекты все также остаются относительными, то общественные выглядят уже более строгими (и можно отметить, что это в значительной мере относятся к экономическим (политэкономическим) закономерностям).
Наиболее строгой областью является естественнонаучная: для исследования ее феноменов могут применяться даже абстрактные (математические) методы, так как законы природы (физики, биологии) хорошо описываются с помощью математики.
В-восьмых, так как в информационных технологиях никак нельзя избежать субъективизма и в них преобладает случайность выбора, в том числе инструмента исследований, то, следовательно, имеет место случайность исполнения информационных технологий и получения результатов и даже во многих случаях признаваемая неинтерпретируемость результатов.
Существенны и другие положения (их полный перечень может быть приведен и обсужден отдельно), но даже уже обозначенные положения дают понимание методологической необоснованности, частичности, относительности, субъективности и случайности как понимания и, следовательно, применения методов в информационных технологиях и в аналитике данных, так и их классификации.
В2. Некоторые выводы о самих информационных технологиях.
Итак, существующая научная классификация методов информационных технологий субъективна, неполна, случайна и т.д. Она никуда не годится.
И не трудно согласиться с общеизвестным мнением о том, что классификацию инструментов информационных технологий осуществить весьма трудно, и при этом теперь понятно, что не в силу их количества, а по причине субъективизма и отсутствия соответствующей методологии.
Отсутствие (возможности) единой классификации методов, алгоритмов и программных средств (языков программирования, программных продуктов и систем и т. д.) в сфере информационных технологий и даже их частной классификации в отдельных подразделениях информационных технологий связано не столько с большим количеством инструментов, как это обычно считается, сколько с отсутствием а) методологии информационных технологий и б) методологии их классификации.
Быть может, поэтому информационные технологии в науках понимаются утилитарно и механистически – как совокупность методов, которыми можно обработать данные или информацию в силу того, что методы формально можно применять к данным или информации о том или ином предмете, причем в условиях, когда в науках нет определения ни данных, ни процедур их обработки, ни регламентов выбора методов и т.п.: методы попросту выбираются как подходящие для обработки данных, собранных неким интуитивно понятным кому-то образом (но не обоснованным хотя бы по причине отсутствия корректного определения данных), что к тому же совсем не означает возможность решения актуальной (а не выдуманной) задачи (в том числе потому, что она не следует из данных).
Похоже, что на объективно-научных основах универсальную классификацию методов информационных технологиях вообще создать нельзя.
Подлежат исследованию предметные, методологические и иные негативы существующих информационных технологий (их полный перечень может быть приведен и обсужден отдельно). Осмысление и исключение негативов информационных технологий, быть может, и не интересно их специалистам, так как многие наглядные негативы до сих пор обходятся стороной, не обозначаются, оставлены для решения в конкретных случаях, в основном за счет специфики ситуации и надежды на квалификацию сотрудников.
Иными словами, необходимо создавать новую классификацию методов информационных технологий, определив для нее базовые и предметные положения, ряд из которых будет указан ниже (и в последующих статьях), – например, классификацию, ориентированную на определенную сферу, а еще лучше – предназначенную для исследования конкретного предмета, определенные характеристики которого уже известны (отсюда – идея создания экономической информационной технологии). Однако нельзя исключать и обобщение, по сути, абстракцию, ибо иначе невозможно будет выделить то общее, что присуще всем информационным технологиям, что определяет их и основу применения их методов (отсюда – идея создания информационно-логической парадигмы информационных технологий).
В3. Некоторые выводы о развитии исследований информационных технологий и их методов.
Актуальны пролонгирующие выводы, имеющие значение при диалектическом анализе и построении информационных технологий (их полный перечень может быть приведен и обсужден отдельно): например,
– необходимо осмысление и исключение негативов информационных технологий,
– методы, которые фактически произвольно применяются по усмотрению специалиста в зависимости, по сути, от случайных данных и мнений, могут рассматриваться как система случайных положений (величин), что позволяет применять вероятностные инструменты для анализа самих информационных технологий,
– гуманитарно-субъективные положения информационных технологий понимаются как основание принципов новых информационных технологий и отдельного направления исследований,
– методы информационных технологий требуют системного рассмотрения и классификации,
– методы информационных технологий требуют не только упорядочивания, организации и контроля (особенно многоэтапная работа группы аналитиков данных), но и создания инструментов контроля исполнения методов, что обусловливает принципиально новую область исследования (этому вопросу в диалектическом программировании уделено колоссальное значение),
– определяется различение создаваемой диалектической информационной технологии и компьютеризированного (алгоритмизированного) диалектического познания, о котором уже шла речь на сайте, а также их компонент и их опосредствования, что позволяет создать универсальный автоматизированный инструмент познания, что приводит к понимаю существа архи актуального для современной диалектики кибер познания.
Существенны и другие положения.
В следующей статье будут рассмотрены некоторые позиции развития диалектических исследований информационных технологий в целом и их методов в частности.
Дискуссии и конференции. Методы.