Парадигмы AI.
- 11.01.26 г.
- 9772225665000 26001
В текущем семестре мы продолжим обсуждение artificial intelligence (AI), начатое в предыдущем семестре, но теперь уже с акцентированием ряда его характеристик, которые будут принципиально важны при его диалектическом обсуждении и определении его перспективного направления развития. При этом еще раз отдельно отметим, что для всех реализаций AI термин «человеческий интеллект» следует понимать как метафору или даже цель. Но степень сходства и то, какой аспект интеллекта имитируется, сильно различается в различных подходах к AI.
1.В предыдущем семестре AI рассматривался в общих чертах в контексте его эволюции: символьный AI (ручное кодирование, программирование) и нейросети (обучение на данных), см. «Эволюция AI».
Итак, AI можно разделить на два лагеря, которые исторически противостояли друг другу, а сейчас рассматриваются как подлежащие объединению:
– символьный AI (Symbolic AI), или классический ИИ, который часто связывают с подходом «сверху-вниз»,
– нейронные сети (Connectionist AI), или статистический AI, который часто связывают с подходом «снизу-вверх».
В целом можно определить следующую иерархию AI:
А. символьный AI (правила и логика)
– экспертные системы,
– логический вывод,
– базы знаний и онтологии;
Б. нейросетевой AI (данные и статистика)
– машинное обучение (включая алгоритмы без НС),
– глубокое обучение (нейросети: ANN, CNN, RNN, Трансформеры, LLM);
В. предполагаемый гибридный AI, или нейро-символьные системы
Г. гипотетический сильный AI (AGI).
2. Более строгое разделение AI определяется с учетом еще одного фактора – получение знаний системой:
– нейросетевой подход основан на обучении, на получении знания из данных, это глубокое обучение,
– другие подходы основаны как на обучении, на получении знания из данных, это классическое ML (Machine Learning, машинное обучение), так и на программировании, на получении знаний от человека, это символьный AI.
При этом отдельно отметим, что в категорию «AI, которые не являются нейронными сетями», входят также и алгоритмы машинного обучения, которые тоже учатся на данных, но при этом не являются нейросетями.
3. Еще два вида разделения – это разделения по «железу» и архитектурному принципу, которые целесообразно рассматривать вместе.
Это специфические виды разделения переводят рассмотрение с уровня функционала на уровень системотехники и вычислительной парадигмы. Их можно назвать парадигмами: соответственно, парадигмы «мозг» и «калькулятор».
Нейросетевая структура.
Она характеризуется следующими аспектами:
– вычислительный принцип – параллелизм: одна операция применяется ко всем элементам данных одновременно,
– аппаратная основа: GPU (видеокарта) и TPU (тензорный процессор) [еще следует указать нейроморфные чипы], которые имеют множество простых ядер, идеально приспособленных для одновременного выполнения миллионов однотипных операций (матричные и тензорные умножения), из которых и состоят вычисления в нейросетях,
– объект моделирования: работа биологического мозга, где огромное количество нейронов работают параллельно,
– исполнение: нейросети – это software, который реализует конкретную архитектуру, а TPU/GPU – это hardware, созданное для его эффективного исполнения,
– программная реализация: нейросети, глубокое обучение,
– что имитируется: интуиция, образное мышление человека,
– принцип работы: обучение на данных (выявление паттернов),
– ключевая операция: матричное умножение.
Вычислительная структура (логика).
Она характеризуется следующими аспектами:
– вычислительный принцип: последовательное выполнение инструкций – одна команда выполняется за другой по четкому алгоритму,
– аппаратная основа: CPU (центральный процессор), который имеет несколько мощных и сложных ядер, оптимизированных для быстрого выполнения линейных, ветвящихся алгоритмов и для работы с сложной логикой,
– объект моделирования: работа человеческого сознания, осуществляющего логический вывод по формуле «если… иначе…»,
– исполнение: алгоритмы, работающие по формулам, – это software, написанный для последовательного выполнения на CPU,
– программная реализация: экспертные системы, алгоритмы, построенные на формулах,
– что имитируется: логика (условные переходы «если… иначе…»),
– принцип работы: ручное кодирование (выполнение правил),
– ключевая операция: условные переходы (если… иначе…).
Следует отдельно отметить, что «железо» (TPU vs CPU) и «софт» (нейросеть vs экспертные системы) идеально соответствуют друг другу в рамках двух этих парадигм.
Вывод: разделение на архитектуру массового параллелизма («мозг»/нейросети/TPU) и архитектуру последовательных вычислений («калькулятор»/экспертные системы/CPU) является основным системотехническим различием AI, которое и порождает все то функциональное различие, которое обычно обсуждается, а в современной диалектике стало еще и принципом развития AI.
>> Дискуссии и конференции. AI