Классификация смесей: Классификация смесей

Содержание

Классификация смесей

Подразделение детских смесей по приближению их состава к грудному молоку и лечебным свойствам:

A. Высокоадаптированные детские смеси. В состав таких смесей входят следующие вещества: молочная сыворотка, таурин, холин, лецитин, инозитол. Такие смеси применяются для детей с периода новорожденности (смеси для новорожденых и недоношеных детей обозначается индексом ПРЕ или 0, а с рождения до 6 месяцев — цифрой 1).

К таким смесям относятся (познакомиться поближе с каждой из этих смесей можно ниже): Нутрилон, Нан, Альфаре, Альпрем, Прехипп и Хипп-1, Энфамил-1, Пре-хайнц, Бона, Сэмпер Бэби, Хайнц, Хумана.

B. Менее адаптированные смеси(эта группа смесей обычно обозначается цифрой 2, подходит с 6 месяцев). В этих смесях содержится белок коровьего молока – казеин: Симилак, Энфамил, Энфамил с железом, Энфамил-2, Нутрилон-2.

C. Частично адаптированные смеси. В данных смесях отсутствуют биоактивные добавки (таурин, холин, многие жирные кислоты). Примеры таких смесей: Малютка, Малыш, Детолакт, Милумил, Агуша.

D. Лечебные и антиаллергенные смеси:

    1. Безлактозные и низколактозные смеси для детей с пониженной активностью фермента лактазы в кишечнике, непереносимостью лактозы, склонностью к поносам (диарейный синдром), острыми кишечными инфекциями: Ал 110, Нутрилон низколактозный, Симилак-изомил, Симилак Альдолак.

    2. Адаптированные безмолочные смеси, содержащие соевый белок и предназначенные для детей с непереносимостью белка коровьего молока, лактозы, с галактоземией: Бона-Соя, Нутри-Соя, Соя-Сэмп, Тутелли-соя, Хайнц соевая смесь, Хумана SL, Хумана-Соя, Энфамил Соя.

    3. Адаптированные смеси на основе гидролизата сывороточного белка для детей с тяжелыми формами аллергии на белок коровьего молока и лактозу, с глубокой недоношенностью, муковисцидозом, нарушением кишечного всасывания (синдромом мальабсорбции), в пред- и послеоперационный период: Альфаре, Пепти-Юниор, Портаген, Хумана ГА 1, Хумана ГА 2, Хипп ГА 1, Хипп ГА 2.

    4. Адаптированные молочные смеси, обогащенные железом: Детолакт, Нестоген, Нутрилон 2, Симилак с железом, Сэмпер Бэби 1, Сэмпер Бэби 2.

    5. Адаптированные смеси для вскармливания детей, рожденных преждевременно, с малой массой и недостаточной прибавкой массы тела:Алпрем, НАН пре, Хипп пре, Хумана пре, Энфалак.)

    6. Адаптированные смеси для вскармливания детей с синдромом срыгивания, рвотой: Нутрилон –АР (антирефлюкс), Симилак Изовок, Сэмпер Лемолак, Фрисовом.

    7. Адаптированные смеси для детей с дисбактериозом кишечника: НАН кисломолочный, Бифидус, НАН с бифидобактериями.

    8. Смеси без глютена для детей с целиакией: Ал-110, Соя-Сэмп, Хипп 1, Хумана HN, Хумана HN с МСТ.

    9. Смеси без фенилаланина для детей с фенилкетонурией: Милупа, Фенил Фри, Симилак.

Классификация детских молочных смесей . Педиатрия

Основу рационального негрудного вскармливания должно составлять использование специализированных продуктов детского питания промышленного выпуска – современных заменителей женского молока – адаптированных молочных смесей («формул» – по терминологии зарубежных авторов). Существуют различные виды молочных смесей. Все они могут подразделяться по нескольким принципам.

С учетом возраста ребенка (имеют соответствующую цифровую маркировку и являются базовыми):

1. «начальные» смеси, «последующие» смеси, смеси для детей от 0 до 12 месяцев жизни, смеси для детей старше 1 года.

2. По консистенции: сухие и жидкие молочные смеси.

3. По характеру белкового компонента: с преобладанием сывороточных белков, с преобладанием казеина.

4. По характеру обработки: пресные и кисломолочные.

5. По наличию функциональных компонентов: с добавлением и без добавления функциональных компонентов.

Детские молочные смеси можно разделить на три большие группы: базовые – для вскармливания здоровых детей; лечебно-профилактические; лечебные.

Базовые смеси для кормления здоровых детей изготавливаются на основе коровьего молока Чем больше смесь приближена по составу к грудному молоку, тем более она соответствует потребностям и возможностям желудочно-кишечного тракта ребенка. Смеси на основе коровьего молока могут быть жидкими («Туттеле») и сухими с преобладанием сывороточных белков (их большинство), либо казеина.

Смеси с преобладанием сывороточных белков:

1. начальные – для вскармливания детей первых 4–5 месяцев жизни: «Беллакт Оптимум-1», «Фрисолак-1», «НАН-1», «ХиПП-1», «Хумана-1», «Нутрилак-0–6», «Нутрилон-1», «Сэмпер Бэби-1» и др.;

2. последующие – для детей второго полугодия; имеют более высокое содержание белка, другое соотношение сывороточных белков и казеина в сторону увеличения казеиновой фракции, более высокое содержание железа, цинка, кальция. К этим смесям относятся «Беллакт Оптимум-2», «Фрисо- лак-2», «НАН-2», «ХиПП-2», «Хумана-2», «Нутрилон-2», «Сэмпер Бэби-2», «Нутрилак-6–12» и др.;

3. смеси для вскармливания недоношенных и маловесных детей: «Беллакт-ПРЕ», «Фрисо-ПРЕ», «Пре-НАН», «Хума- на-0», «Пре-Нутрилак», «Пре-Нутрилон» и др.;

4. смеси для детей от рождения до 12 месяцев используются для кормления детей на протяжении всего 1 -го года жизни: «Бэби», «Нутрилак-0–12». Таких смесей становится все меньше, ибо потребности детей по мере роста меняются, а состав смеси стабилен;

5. смеси для детей от 1 до 3 лет: «Беллакт Оптимум-3», «НАН-3».

Жидкие молочные смеси на отечественный рынок продуктов детского питания в настоящее время не поставляются.

К казеинодаминантным смесям относятся «Симилак-1, 2» и «Нестожен-1, 2».

По мере накопления новых сведений по количественному и качественному составу женского молока и влиянию его отдельных ингредиентов на различные функции в организме ребенка во многие смеси вносятся биологически активные добавки.

Некоторые смеси содержат нуклеотиды, повышающие иммунологическую защиту организма и усвоение им железа, а также обладающие бифидогенными свойствами. Это «Беллакт Иммунис-1, 2, 3», «Фрисолак-1, 2», «НАН-1, 2», «СМА», «Ма- мекс» и др.

Есть группа смесей, содержащих пребиотики – компоненты питания, которые не расщепляются в верхних отделах пищеварительного тракта доходят до толстой кишки и стимулируют там рост защитной бифидум-флоры, являясь пищевым субстратом для бифидобактерий.

Пребиотики – это лактулоза (синтетический изомер лактозы), инулин (полимер фруктозы), олигосахариды (галактооли- госахариды и фруктоолигосахариды). Олигосахариды содержат «Фрисолак-1, 2», «Нугрилон-1, 2», «Мамекс», «Комфорт-1, 2», «Лакгофидус». Лактулозу содержит «Сэмпер Бифидус».

В других смесях находятся пробиотики – это живые микроорганизмы, которые являются физиологичной для ребенка флорой и положительно влияют на состояние микробиоценоза кишечника. Смеси, содержащие пробиотики, могут быть кисломолочными и пресными: «Беллакт Иммунис-1, 2, 3», «НАН- 1,2с бифидобактериями», «Нутрилак-бифи».

Лечебно-профилактические смеси можно использовать как при лечении аллергических заболеваний, так и для профилактики. Среди них выделяют:

1. смеси, приготовленные на основе козьего молока – для детей, у которых есть атопия: «MD мил козочка-1, 2» (Нидерланды), «Нэнни» (Новая Зеландия) для детей 1-го года жизни и «Нэнни золотая козочка» (Новая Зеландия), для детей старше 1 года, смесь «Алматея» для детей старше 3 лет и кормящих матерей. При непереносимости белков коровьего молока могут быть использованы эти смеси, так как главные антигенные детерминанты коровьего молока – альфа-S-l-казеин и (кггакто- глобулин – в козьем молоке отсутствуют;

2. кисломолочные смеси: «Беллакт КМ-1, 2», «НАН кисломолочный-1, 2», «Бифидобакт-О» и «Бифидобакт-1». Кисломолочные смеси рекомендуются при повышенном риске инфекционного процесса любой локализации, для профилактики и коррекции дисбиоза кишечника (во время и после лечения антибиотиками), детям с умеренными функциональными нарушениями пищеварения, в качестве диетотерапии при кишечных инфекциях, как прикорм в питании здорового ребенка. При назначении кисломолочных смесей необходимо соблюдать следующие правила: они не должны использоваться на 1-м месяце жизни ребенка; объем кисломолочных смесей должен составлять не более 30–50% суточного количества пищи;

3. смеси с низкой степенью гидролиза белка – смеси на основе частичного гидролизованного белка коровьего молока рекомендуются для искусственного вскармливания и докорма детей с высоким риском атопии. Представители данной группы – «Беллакт ГА», «НАН ГА-1, 2», «Нутрилон ГА-1, 2», «Ху- мана ГА-1,2», «ХиПП ГА-1, 2», «Нутрилак ГА», которые могут быть использованы для питания детей с аллергией на белки коровьего молока.

Лечебные смеси назначаются при определенных заболеваниях у детей. Среди них выделяют

1. смеси на основе соевого белка: «Беллакт-Соя», «Фрисо- сой», «Хумана-СЛ», «НАН-Соя», «Нутрилак-Соя», «Нутри- лон-Соя», «Энфамил-Соя» и др. Не содержат молочного белка, лактозы, глютена, поэтому могут применяться при аллергии к белкам коровьего молока, а также при лактазной недостаточности, целиакии и галактоземии. Эти смеси рекомендуется использовать не менее 3 месяцев, чтобы оценить их эффективность;

2. низко- и безлактозные смеси используются в питании детей со вторичной лактазной недостаточностью, которая развилась вследствие повреждения энтероцита при инфекционных, воспалительных, аутоиммунных заболеваниях кишечника, при синдроме короткой кишки. К низколактозным смесям относятся: «Беллакт НЛ+», «Нутрилон низколактозный», «Нутрилак низколактозный», «Хумана ЛП», «Хумана ЛП+СЦТ». При первичной лактазной недостаточности, связанной с врожденной ферментативной недостаточностью, и в некоторых случаях с вторичной лактазной недостаточностью назначаются безлактозные смеси: «НАН безлактозный» и «Нутрилак безлактоз- ный»;

3. смеси на основе белка с высокой степенью гидролиза применяются при наличии у ребенка аллергии к белкам коровьего молока. По субстрату гидролиза смеси делятся на две группы: в одной гидролизу подвергается сывороточный белок («Фрисопеп АС», «Альфаре», «Нутрилак Пептиди СЦТ», «Ну- трилон Пепти ТСЦ»), в другой – казеин («Фрисопеп», «Преге- стимил», «Нутрамиген»). Оптимальное содержание аминокислот не должно превышать 10–15%. В смеси «Альфаре» их 20%, во «Фрисопепе» – 15%, «Фрисопепе АС» – 22%. Недостатком этих смесей является горько-соленый вкус. В особо тяжелых случаях атопии используются смеси на основе аминокислот «Nutri-Junior», «Neocate», «Criticar», «Vital», «Vivonex». На белорусском рынке они отсутствуют;

4. смеси с загустителями используются для лечения функ-циональных нарушений желудочно-кишечного тракта (срыги- вание, запоры, колики): «Беллакт АР+», «Фрисовом 1,2», «Ну- трилон АР», «Хумана АР», в качестве загустителя в них используется камедь, и смеси «Лемолак», «Энфамил АР», «Ну- трилон Комфорт», в которой в качестве загустителя используется крахмал. Для достижения желаемого эффекта обычно достаточно дать ребенку перед кормлением 30 мл смеси в отдельной бутылочке. Соответственно, объем основной смеси должен быть уменьшен. Если 30 мл недостаточно, то долю смеси с загустителем можно увеличить и подобрать индивидуальную дозу, вплоть до кормления ребенка ею полностью. После достижения стойкого эффекта (обычно через 2–3 месяца) ребенка переводят на ту смесь, которую сочетали со смесью с загустителем.

При выборе смеси необходимо учитывать:

1. состояние здоровья ребенка;

2. возраст ребенка;

3. степень адаптированности смеси;

4. индивидуальную переносимость смеси;

5. социально-экономические и материальные условия жизни семьи.

В практике нередки случаи, когда ребенок плохо переносит одну из адаптированных смесей, но хорошо переносит другую смесь. При задержке темпов физического развития ребенка необходимо проводить расчет и коррекцию питания.

Десять «золотых правил» детского питания заключаются в следующем.

1. Материнскому молоку или его заменителям для детей первой возрастной группы, а затем молочным смесям для детей второй возрастной группы (последующие формулы) отводится первостепенная роль в питании детей до 12 месяцев.

2. Детям от 1 года до 3 лет также лучше давать не обычное коровье молоко, а специальное сухое молоко для детей или продолжать давать специальные молочные смеси, предназначенные для детей старше 6 месяцев (последующие формулы).

3. Необходимо с первых же месяцев жизни ребенка ограничить потребление соленых, жирных и сладких продуктов. Правильное воспитание вкуса является залогом предупреждения ожирения и других болезней.

4. Ребенок должен относительно много пить, больше чем взрослый.

5. Необходимо равновесие, как в отношении качества, так и количества используемых продуктов. Не следует увеличивать потребление пищи под предлогом стимулирования роста ребенка.

6. Пища ребенка до 3-летнего возраста по своему качеству, количеству и консистенции должна отличаться от пищи взрослого человека.

7. Преждевременное, с опережением потребностей ребенка, введение в рацион продуктов, не соответствующих его возрасту, не только нецелесообразно, но и влечет за собой множество нежелательных последствий.

8. При организации питания необходимо приспосабливаться к индивидуальному естественному ритму жизни ребенка.

9. Нельзя принуждать ребенка есть. У ребенка удовлетворение, получаемое от еды, и разнообразие пищи должны быть неразрывно связаны.

10. Не следует преждевременно отказываться от продуктов питания, рецептура которых разработана специально для детей (каши быстрого приготовления, консервированное пюре в баночках, детское печенье).

Виды детских молочных смесей для питания новорожденных

Идеальным и самым правильным питанием для малыша всегда было и остается материнское молоко — естественное питание, приготовленное самой природой. Однако существует ряд причин, когда малыша рекомендуется перевести на искусственное вскармливание. В таких случаях важно выбрать подходящую смесь для вашего ребенка, чтобы обеспечить ему полноценного детское питание и развитие.

Видов детских молочных смесей много и главное в выборе – понимать, какую задачу в питании они решают. История существования молочных смесей насчитывает уже более 150 лет. Научные исследования и разработки помогают создавать такие формулы, которые делают состав многих современных молочных смесей максимально приближенными к материнскому молоку. Такое питание изготавливается в соответствии с возрастными особенностями пищеварения и метаболизма детей первого года жизни.

Каждый родитель стремится дать своему малышу только лучшее, но в вопросах выбора вида молочной смеси для детского питания, важно понимать, что идеального варианта нет. Зачастую родителям непросто выбрать подходящую смесь для малыша. Попробуем вместе разобраться в многообразии, которое предлагает сегодня рынок детского питания, а это более 80 видов молочных смесей для детей первого года жизни.

Классификация видов детских молочных смесей

Глобально все существующие на сегодняшний день смеси делятся на 3 основные группы:

  • смеси для искусственного вскармливания здоровых малышей
  • смеси, рекомендуемые для искусственного вскармливания малышей с особыми пищевыми потребностями
  • смеси, предназначенные для лечебного питания малышей с какой-либо патологией

Далее детские молочные смеси делится на две основные группы – адаптированные и частично адаптированные. Это деление соответствует возрастной классификации смесей, так как их формулы отличаются в зависимости от возраста малыша, для которого она предназначена. Состав материнского молока меняется с ростом малыша. Это связано с тем, что по мере роста и развития ребенка совершенствуется и система пищеварения, меняются потребности организма в питательных веществах. Чтобы правильно подобрать смесь по возрасту и потребностям ребенка, на упаковке той или иной смеси указывается номер формулы:

«0» /«pre» в названии – предназначена для новорождённых недоношенных или маловесных детей

«1» – смесь для детей от 0 до 6 месяцев

«2» – смесь для малышей от 6 месяцев до 1 года

«3» – смесь для детей старше 12 месяцев

Адаптированные смеси

По своему составу такие смеси максимально приближены к материнскому молоку, а содержащиеся в них питательные вещества находятся в таком же количестве, как и в грудном молоке. Их рекомендуют новорожденным, так как эти смеси лучше и легче усваиваются организмом младенца.

Для изготовления адаптированных смесей используют коровье молоко. В процессе производства, коровье молоко адаптируют, чтобы оно больше соответствовало грудному – искусственно уменьшают количество белка и солей кальция, видоизменяют жировой состав, увеличивают количество молочного сахара (лактозы). Любая адаптированная смесь включает в себя витамины и все микроэлементы в качественно и количественно сбалансированном составе. Большинство адаптированных молочных смесей содержат таурин, лютеин, инозитол, пребиотики, галакто- и фруктоолигосахариды. Эти вещества необходимы малышу для построения сетчатки глаза, правильного развития головного мозга, нормального пищеварения и всасывания жиров и углеводов. Калорийность при кормлении младенца адаптированной смесью соответствует той, которая свойственна питанию при естественном вскармливании.

Как правило, молочные смеси для грудных детей первых 6 месяцев жизни называют смесями первого вида, а на упаковке стоит маркировка – «1».

Частично адаптированные смеси (последующие)

В таких смесях лишь некоторые компоненты по количественному содержанию схожи с материнским молоком, поэтому они подходят для детей старше 6 месяцев. В состав частично адаптированных смесей помимо лактозы, включают уже и сахарозу, а жирнокислотный состав становится стабилизирован не точно.

В основе формулы «последующих» смесей используется казеин – белок коровьего молока. Дополнительно в их состав вводят практически все те же компоненты, что и в адаптированные смеси. Степень адаптированности смеси зависит от того, насколько легко смесь усваивается детским организмом. А этот фактор связан именно с тем, что лежит в основе смеси – деминерализованная сыворотка или белок коровьего молока. Поэтому частично адаптированные смеси, молочная основа которых – казеин, усваиваются тяжелее. И давать их рекомендуется только с 5-6 месяцев. Энергетическая ценность частично адаптированных смесей выше и соответствует потребностям детей возраста 6-12 месяцев. Смеси этого вида имеют маркировку упаковки – «2».

Для детей от года до трех лет в питании используются смеси с маркировкой «3». По своему составу они уже больше похожи на обычное коровье молоко, но обогащены дополнительными питательными веществами, чтобы обеспечить полноценный рост и развитие подросшего активного и подвижного ребенка. Смеси «троечки» также служат источником достаточного количества витамина Д, кальция, полноценных молочных белков, полезных омега-три и омега-шесть кислот в организме ребенка, снижают в детском питании количество молочных жиров. 

В линейке Valio Baby родители малышей найдут все три возрастные маркировки детского питания – Valio Baby 1 (0-6 месяцев), Valio Baby 2 (6-12 месяцев), Valio Baby 3 (12+). Разработкой этих продуктов занимались лучшие специалисты Финляндии в области питания, смесь изготовлена по принципу Valio Clean Label, что означает полную натуральность состава в сочетании с лучшим финским молоком без добавления искусственных красителей, консервантов, ГМО и пальмового масла.

Помимо группировки смесей по возрасту и составу, детские молочные смеси также классифицируются: 

По консистенции – смеси бывают сухими, в виде порошка или жидкими.

По составу – казеиновые и сывороточные. В составе грудного молока содержатся обе эти составляющие, поэтому важно, чтобы в смесях сохранялись эти же пропорции. Напомним, что казеиновыми смесями рекомендуется кормить малышей старше 6 месяцев.

По назначению (специализированные молочные смеси)

Если есть потребность, связанная с особенностями состояния здоровья малыша,  педиатры назначают специальные смеси для кормления. Это, как правило, безлактозные смеси, смеси с повышенным содержанием железа, содержащие молочнокислые бифидобактерии, камедь или лактулозу. Для недоношенных и маловесных детей созданы особые формулы с повышенным содержанием белка, витаминов и сывороточного протеина (отмечены маркировкой «0» или «пре-»). Для детей, склонных к проявлениям аллергии, разрабатываются гипоаллергенные смеси (в названии таких смесей включают аббревиатуру «НА»). Если у ребенка обнаружена непереносимость белка коровьего молока, то следует обратить внимание на безлактозные и соевые смеси. Атирефлюксные смеси помогут малышам, страдающим от частых срыгиваний (имеют маркировку «A.R.»).

#PROMO_BLOCK#

При выборе молочной смеси для ребенка, в первую очередь важно проконсультироваться с педиатром! Только врач поможет правильно подобрать смесь, которая позволит органично расти и развиваться малышу, будет обладать сбалансированным составом и хорошо усваиваться. Ведь от правильного питания зависит здоровье и настроение вашего крохи. Наши эксперты подготовили для вас статью о правильном хранении детской молочной смеси, с которой вы можете ознакомиться в блоге.

Литье в холоднотвердеющие смеси

К холоднотвердеющим относятся все смеси, процесс отвердения в которых запускается без участия сушильных печей. В раствор вводят отвердители и связующие вещества, обеспечивающие самозатвердевание смесей в естественных условиях в течение 10-15 минут. Современная технология напоминает традиционную, при которой металл заливали в песчано-глинистые формы. Разница в том, что сегодня в качестве связующих элементов включают искусственные смолы.

Когда целесообразно литье в холоднотвердеющие смеси

Чтобы смолы отвердели, используют технологию продувки. Такой способ позволяет изготавливать отливки 7 класса точности, соответствующие параметрам ГОСТ 26645-85.

Есть две причины, из-за которых ХТС использовать нежелательно: высокая стоимость синтетических смол и вызывающая сложности регенерация смесей. С экономической точки зрение участие холоднотвердеющих смесей обосновано только в ситуации, при которой масса формы к массе заливки относится в пропорции 3:1. По этой причине смеси применяют не всегда, а в основном для производства стержней, основное назначение которых — формовать в отливе полости.

К положительным сторонам метода литья в ХТС относят высококачественные поверхности, без засоров и газовых дефектов, которые могут возникать при использовании других технологий.

Классификация смесей

К основным компонентам, которые входят в состав ХТС, относятся кварцевый песок, органическая или полимерная смола и вещество, которое отвечает за быстрое отверждение смолы — катализатор. Кроме перечисленных составляющих в смесь добавляют регуляторы скорости отверждения, а также другие компоненты, благодаря которым материал достигает необходимого технического состояния. Например, некоторые из них делают более легким процесс выбивки, другие повышают антипригарность, термостойкость или газопроницаемость.

Сейчас производят более 100 разновидностей ХТС, применяемых для изготовления стержней и форм. Их можно разделить на категории, используя такие критерии, как:

  • способ отверждения — продувка реагентами или ввод катализатора;
  • вид связующего компонента — неорганического, органического, смешанного;
  • реологические качества смесей — жидкоподвижные, сыпучие, пластичные;
  • длительность отверждения — от 5-180 секунд до 30-45 минут.

Связующие подбирают, учитывая экономические показатели, экологические требования, необходимое качество отливок, регенерирующие свойства смеси, если ее планируется использовать повторно. Формы и стержни, изготовленные с помощью ХТС, могут иметь простую или сложную структуру, обладать высокой чистотой поверхности и максимально точной геометрией.

Как происходит процесс литья

Основное оборудование для приготовления холоднотвердеющих смесей — мощные шнековые или лопастные смесители. Вследствие быстротекущего производственного процесса установки размещают прямо на участке для изготовления форм.

В первую очередь в смеситель загружают кварцевый песок, затем из отдельных резервуаров по трубам поступает жидкий катализатор, следом за ним — смола, также в жидком виде. Пластичность состава сохраняется недолго, не более получаса. За это время нужно успеть выполнить формовку, иначе смесь затвердеет и производство остановится. Из смесительной установки раствор ХТС подается напрямую в стержневые ящики — опоки.

Особенности литья в ХТС

Технологию литья в ХТС ценят за то, что готовые формы для отлива деталей можно применять неоднократно. Некоторые компании целенаправленно используют этот способ, чтобы заметно минимизировать затраты — не приходится каждый раз изготавливать новые формы. Таким образом, компенсируется высокая себестоимость получения ХТС, при этом готовые отливки выходят идеально точными, ровными и гладкими. Они не требуют доработки, которая повлекла бы за собой дополнительные вложения.

ХТС процесс — это производство форм и стержней для отливок, для которого используют холоднотвердеющие смеси. Их обычно готовят из сыпучих составов путем воздействия газовыми реагентами. За прочность раствора отвечают вещества с сильными скрепляющими характеристиками, их также добавляют в процессе изготовления смеси. Термообработки для застывания и отвердения не требуется.

ХТС-технология возникла и стала востребованной около 10 лет назад, то есть ее можно считать сравнительно молодой. Ее нельзя отнести к массовым методам вследствие некоторой сложности процесса и высоких затрат, но преимущества технологии уже оценили металлургии и других отраслях промышленности.

Формовка происходит путем заливки ХТС в опоку. Затем требуется небольшое время для отверждения, обычно 20-30 минут. Температура на участке поддерживается в области комнатной, то есть около +20°С. В результате получаются литейные ХТС. По размеру они меньше песчаных аналогов, но по стоимости выше, поэтому их редко выбирают для массового производства. Но зато литьем в ХТС легче производить сложные отливки, в которых нужно делать углубления.

Сам процесс происходит быстро, без лишних процедур и манипуляций. Главные условия для достижения требуемого результата — хорошее качество сырья и точное время изготовления. Это простая технология даже по сравнению с литьем в землю. Там необходимо производить трамбовку заготовки, а это дополнительные усилия, более длительный промежуток времени и, в целом, усложненный процесс.

Готовые формы после литья можно применять повторно. Если производство не ограниченное, а серийное, за счет многократного использования происходит значительная экономия и материальных средств, и трудовых затрат. Готовое изделие изначально получает необходимую, точно выверенную форму с гладкими стенками без повреждений и дефектов. Отсутствие доработки также положительно сказывается на экономии средств.

Для производства сложных изделий закладываются припуски на доработку в границах 1-3 мм. Это мало, если сравнить с альтернативными технологиями. Например, при литье в песок припуски 5-40 мм, как и доработка, считаются нормой, а большое количество отходов — естественным последствием. Не удивительно, что при массовом производстве металлические отходы просто огромны и невыгодны предприятию. На этом фоне более экономичные ХТС уже не кажутся настолько дорогостоящими.

Некоторые виды металла отличаются высокой ценой и сложной обработкой, поэтому для них лучше подбирать метод, благодаря которому создаются высококачественные отливки без доделок. К таким металлам относятся дорогие виды стали, алюминий медь, легированный чугун.

Достоинства формования из ХТС

Все, кто выбирают эту технологию, опираются на ее преимущества перед альтернативными технологиями:

  • возможность автоматизировать производственный процесс;
  • высокое качество отливок, соблюдение максимально точных размеров;
  • снижение энергозатрат вследствие естественного изготовления без нагрева;
  • минимальное количество повреждений и дефектов при выпуске форм;
  • уменьшение трудоемкости операций по доработке;
  • снижение себестоимости из-за использования простых установок;
  • минимизация вредных выбросов;
  • общее повышение качества труда.

Перечисленные преимущества и дали старт более активному применению ХТС в литейном производстве. Но нужно помнить и про сопутствующие минусы. Один из них — токсичность связующих компонентов, из-за которой к изделиям при хранении, транспортировке и эксплуатации предъявляются особые требования. Второй недостаток — отсутствие в составе наномодификаторов, положительно влияющих на кристаллизацию расплава и изменение формовочной массы.

ХТС-процесс получил одобрение на литейных предприятиях благодаря преимуществам и с экономической точки зрения. Благодаря ему происходят следующие процессы:

  • объем формовочных смесей уменьшается в 3-4 раза за счет присутствия в составе 90-95% регенерата;
  • мелкосерийное и серийное производство становится более гибким и оперативным благодаря быстрой замене оснастки;
  • сокращается количество цехов и внутрицеховых транспортировок из-за снижения объемов операций.

Вследствие перечисленных положительных сторон и преимуществ современные ХТС становятся все более популярными и востребованными, несмотря на токсичность связующих компонентов. Негативные моменты компенсируются сокращением вредных выбросов, снижением энергозатрат, улучшением условий труда и ростом рентабельности производства.

Разделение неоднородных смесей для отрасли строительных материалов

Команда направления «Производственный консалтинг» HOSOKAWA ALPINE разрабатывает индивидуальные решения для сложных задач. Один из вопросов, который был поставлен на повестку дня — разделение неоднородных смесей. Данную проблему удалось решить за счет нового процесса с использованием технологии HOSOKAWA ALPINE.

СЛОЖНОСТЬ КЛАССИФИКАЦИИ И ВОССТАНОВЛЕНИЯ МАТЕРИАЛА

Когда порошки с аналогичными физическими свойствами соединяются в неоднородную смесь, их классификация и дальнейшее восстановление представляют собой серьезную задачу. Это особенно актуально с точки зрения сохранения ресурсов и вторичного использования (рециклинга). Компания HOSOKAWA ALPINE, один из ведущих поставщиков оборудования для обработки порошков и выдувной экструзии пленки, смогла найти решение этой проблемы благодаря целому ряду тестов, проведенных сотрудниками отдела производственного консалтинга.

С 2018 года консалтинговый отдел HOSOKAWA ALPINE решает задачи в области планирования производственных процессов и разрабатывает сложные решения, используя свой многолетний экспертный опыт.

Когда задача касается разделения материалов, инженеры сталкиваются с дополнительными трудностями. «Если продукт состоит из материалов со значительными различиями с точки зрения размера и веса частиц, широкий перечень наших технологий классификации позволяет разделить материалы и решить данную проблему. Задача усложняется, когда различия между материалами минимальны, например, когда продукт состоит из нескольких минералов одинаковой тонкости и веса», — объясняет г-н Кристиан Эйзенбарт, производственный консультант технического отдела HOSOKAWA ALPINE.

КЛАССИФИКАЦИЯ КАК РЕШЕНИЕ

В поисках эффективных решений Кристиан Эйзенбарт и его команда смогли определить, что ключевым фактором для разделения материалов является классификация смеси. В ходе этого процесса посредством классификации получают отдельные фракции продукта, а затем их анализируют. В результате можно увидеть, как накапливаются отдельные вещества и при какой границе разделения фракции классификация будет наиболее эффективной. Различные классификаторы могут быть протестированы на соответствие определённому показателю тонкости. Накопление отдельных фракций специалисты определяют путем кислотной варки, потери при прокаливании, исследования изображений с растрового электронного микроскопа в лаборатории HOSOKAWA ALPINE или во внешней испытательной лаборатории.

«После этого предварительного исследования и оценки отдельных фракций мы проводим дальнейшие испытания на соответствующей пилотной установке и, таким образом, можем разработать производственное решение с учетом конкретных задач нашего клиента. Это означает, что восстановление продукта может происходить однородным образом и сэкономит затраты на утилизацию отходов», — объясняет Кристиан Эйзенбарт. Данная технология применяется в отрасли строительных материалов, где добавки необходимо отделять от основного продукта. Например, это требуется для чистящих смесей, применяемых для бетономешалок. Также технология применяется при переработке отходов от централизованной системы аспирации. Подобные задачи по разделению материалов могут быть решены с помощью разработанного нами нового процесса.

 

Классификация и виды сухих строительных смесей — Колхозный двор

Внутренние и наружные строительные работы, отделку, реставрацию каких-либо объектов невозможно выполнить без современных материалов, самыми востребованными среди которых считаются строительные сухие смеси, представленные в разнообразных типах. Состав включает несколько основных групп компонентов: минеральные, инертные наполнители, добавки для улучшения свойств.

В зависимости от видов работ смесь имеет различное процентное соотношение компонентов. Классификация указана в специальном ГОСТ 31189-2015.

Какие бывают сухие смеси по виду вяжущего вещества

Современная технология производства сухих строительных смесей подразумевает использование нескольких видов вяжущих компонентов. Самыми распространёнными считаются цементные, магнезиальные, известковые и гипсовые. Рассмотрим подробнее:

  • цементные. Наиболее востребованными считаются белые и серые портландцементы, быстротвердеющие высокоалюминатные цементы. Первое вещество представляет собой гидравлический вяжущий компонент, который получают методом измельчения однотипного клинкера. В процессе изготовления добавляют небольшое количество гипса, выполняющего отбеливающие функции и регулирующего время затвердения. Чтобы получить цементный клинкер, используют природное сырье в виде мергеля осадочной породы или известняка с глиной. Популярными видами цементных сухих строительных смесей считаются четыре марки – 400, 500, 550, 600;
  • магнезиальные. Вяжущим компонентом выступает белый магнезиальный цемент, который считается самым дорогостоящим материалом. Обусловлен данный фактор тем, что месторождение чистого доломита и магнезита практически не найти. Магнезиальные цементы используются для производства цветных сухих смесей. Окрашиваются натуральными пигментами, например, охрой, сажей, берлинской лазурью, суриком и так далее;
  • известковые. Вяжущим компонентом является смешанное вещество, изготовленное на базе извести. Считается самым популярным типом сухих строительных смесей. Различают два подвида, основанные на известково-пуццолановом компоненте, который содержит гидравлические добавки активного кремнезема, и известково-шлаковом – смесь с добавлением гранулированного доменного шлака.

К четвертой категории относят гипсовые сухие строительные смеси. Является самой большой группой, включающей вяжущие компоненты в виде гипса, высокообжигового гипса, ангидритового цемента, ангидритового вяжущего. Для изготовления используют гипсовый камень, очищенный от вредных примесей, например, органики, мела и глины.

Разновидности сухих смесей по назначению

Исходя из сферы применения, сухие строительные смеси бывают следующих видов:

  • кладочные. Предназначены для кладки кирпича, легких бетонных блоков, камня, фундаментов и так далее. Обладают улучшенными свойствами в виде термостойкости, устойчивости к негативным влияниям;
  • штукатурные. Используются при отделочных работах. Входящие в состав компоненты выполняют защитные и водоотталкивающие функции;
  • шпатлевочные. Бывают двух видов – выравнивающие и финишные. Помогают устранить неровности, создать гладкую и ровную поверхность;
  • клеевые. Используются для укладки облицовочной плитки, монтажа армирующих сеток и других материалов. Обладают водоотталкивающими, морозоустойчивыми и термостойкими свойствами;
  • затирочные. Служат для затирки небольших и широких швов между плитками. Могут быть белыми и окрашенными.

Также сухие строительные смеси отличаются зернистостью и маркой. Основные классификации описаны в ГОСТ. Чем лучше марка, тем качественнее будет строительный материал. Поэтому производители рекомендуют выбирать смеси, исходя из видов работ и личных предпочтений.

Классификация взрывоопасных зон и смесей

Взрывоопасная зона – часть пространства, в котором присутствует или может образоваться взрывоопасная среда в объеме, требующем специальных мер защиты при конструировании и изготовлении оборудования.

Взрывоопасная зона – часть замкнутого или открытого пространства, в котором присутствует или может образоваться взрывоопасная среда в объеме, требующем специальных мер защиты при конструировании, изготовлении, монтаже и эксплуатации оборудования.

Классификация взрывоопасных зон

На территории РФ и ТС на сегодняшний день одновременно используются несколько нормативных документов, определяющих порядок выбора вида взрывозащиты для каждой из представленных взрывоопасных зон. В число этих документов входят гл. 7.3 ПУЭ и ГОСТ Р МЭК 60079. Между ними существуют различия в определениях взрывоопасных зон, поэтому ниже будут приведены классификации по ГОСТ Р МЭК 60079 и гл. 7.3 ПУЭ.

Взрывоопасная газовая среда – смесь с воздухом при атмосферных условиях горючих веществ в виде газа, пара или тумана, в которой после воспламенения происходит самоподдерживающееся распространение пламени.

Горючая пыль – твердые частицы номинальным размером 500 мкм или менее, которые оседают под собственной массой, но могут оставаться во взвешенном состоянии в воздухе некоторое время, которые могут гореть или тлеть в воздухе и образовывать взрывоопасную смесь с воздухом при атмосферном давлении и нормальной температуре.

Горючие частицы – твердые частицы, включая волокна, и летучие частицы номинальным размером более 500 мкм, которые оседают под собственной массой, но могут оставаться во взвешенном состоянии в воздухе некоторое время.

Электропроводящая пыль – горючая пыль, электрическое сопротивление которой равно или менее 103 Ом•м.

Неэлектропроводящая пыль – горючая пыль, электрическое сопротивление которой более 103 Ом•м.

Для газов и паров взрывоопасные зоны делятся на три класса: 2, 1 и 0. Но для классификации зон с горючей пылью недостаточно учитывать только время и аварийность рабочих условий.

Согласно ГОСТ Р МЭК 60079-10-2-2009, определение зон риска распространяется на риск воспламенения от облака пыли с учетом вероятности нарушения слоев горючей пыли.

Скачать статью… 

Классификация веществ и смесей

Основным принципом Регламента о классификации, маркировке и упаковке (CLP) является «самоклассификация» вещества или смеси производителем, импортером или последующим пользователем.

Это включает определение опасности вещества или смеси и сравнение информации об опасности с критериями, изложенными в CLP. Классификация основана на опасных свойствах вещества или смеси, а не на вероятности воздействия и соображениях риска.

Самоклассификация направлена ​​на определение того, представляет ли химическое вещество или смесь физическую опасность, опасность для здоровья и/или окружающую среду, и надлежащее информирование об этих опасностях с помощью соответствующей маркировки в цепочке поставок, когда продукт размещается на рынке, независимо от объема продаж. полученное вещество или смесь.

Самостоятельная классификация

В соответствии с CLP вещество должно быть классифицировано самостоятельно, если оно не имеет согласованной классификации в Приложении VI к CLP и обладает опасными свойствами.Для вещества, которое уже имеет согласованную классификацию (запись в Приложении VI к CLP), согласованная классификация опасности является юридически обязательной для классов опасности и дифференциаций, охватываемых этой записью. Классы опасности и дифференциации, не охваченные в статье, должны быть оценены и соответствующим образом классифицированы.

Могут быть применимы некоторые исключения из гармонизированной классификации, если это оправдано, например, иное физическое состояние или форма вещества, поступившего на рынок, или примечание, связанное с записью в Приложении VI.Кроме того, классификация, указанная в Приложении VI в качестве минимальной классификации, должна оцениваться на основе имеющейся информации, и если есть данные, которые приводят к отнесению вещества к более опасной категории, чем минимальная, должна использоваться более опасная категория. .

Другие неопределенности, связанные с «переводом» опасностей из Директивы об опасных веществах (DSD) в CLP, должны быть тщательно оценены. В любом случае, когда вещество самоклассифицируется (в дополнение к его согласованной классификации в Приложении VI к CLP), решения должны быть обоснованы и согласованы, при необходимости, с другими производителями, импортерами или последующими пользователями.

Для вещества, не включенного в настоящее время в Приложение VI (т. е. вещество не имеет согласованной классификации для какого-либо класса опасности), все соответствующие классы опасности должны быть оценены производителем или импортером, и самоклассификация должна применяться ко всем классам опасности, для которых критерии классификации соблюдены.

Смеси всегда должны быть классифицированы перед выпуском на рынок, поскольку они не подлежат согласованной классификации и маркировке (CLH).

Чтобы получить самоклассификацию, классификатор должен собрать всю доступную информацию и оценить ее адекватность и надежность.Затем информацию необходимо оценить по критериям классификации и принять решение о соответствующей классификации.

Классификация смесей осуществляется аналогичным образом. Их можно классифицировать на основе данных о самой смеси, данных об аналогичных испытанных смесях или данных об отдельных компонентах смеси.

Производители, импортеры и последующие пользователи должны следить за новыми научными или техническими разработками и решать, следует ли проводить переоценку собственной классификации вещества или смеси, которые они размещают на рынке.

GHS 101: Классификация веществ и смесей

СГС 101: Классификация

[Для получения специальных рекомендаций OSHA по классификации см. опасности для здоровья и физические опасности]

Как мы узнали из СГС 101: обзор, первоначальный мандат Саммита Земли 1992 года преследовал две основные цели, связанные с гармонизированной системой: 1) согласованные критерии классификации веществ и смесей в соответствии с их опасностями для здоровья, окружающей среды и физическими факторами; и 2) согласованные элементы информирования об опасности.

IOMC разделил работу по охвату этих двух элементов на три части , каждая из которых разработана отдельным комитетом или организацией:

  1. Критерии классификации опасностей для здоровья и окружающей среды – Разработаны Организацией экономического сотрудничества и развития (ОЭСР)
  2. Критерии классификации физических опасностей – Разработаны Подкомитетом экспертов Организации Объединенных Наций по перевозке опасных грузов (UNSCETDG) и рабочей группой Международной организации труда (МОТ)
  3. Элементы информирования об опасности (включая паспорта безопасности и этикетки) — разработаны МОТ

Три основные задачи для групп, работающих над согласованием критериев классификации:

  1. Сравнение основных систем классификации и выявление схожих или идентичных элементов, а также достижение консенсуса в отношении несходных элементов
  2. Изучить научное обоснование критериев, определяющих опасный класс опасности (например,грамм. острая токсичность, канцерогенность) и достичь консенсуса экспертов в отношении методов испытаний, интерпретации данных и степени обеспокоенности, а также консенсуса в отношении критериев
  3. Достижение консенсуса в отношении процесса или схемы использования критериев при наличии подхода дерева решений или при наличии зависимых критериев в схеме классификации

Как видите, классификация является отправной точкой для информирования об опасности.

Что именно охватывает СГС?

Для классификации СГС применяется к чистым веществам, их разбавленным растворам и смесям.Это не относится к «статьям» в соответствии с определением OSHA.

Вещества  означает химические элементы и их соединения в естественном состоянии или полученные в результате любого производственного процесса, включая любые добавки, необходимые для сохранения стабильности продукта, и любые примеси, полученные в результате используемого процесса, но исключая любой растворитель, который может быть отделен не влияя на стабильность вещества или изменяя его состав.

Смеси  означает смесь или раствор, состоящий из двух или более веществ, в которых они не реагируют.

“Изделие”  означает изготовленный предмет, отличный от жидкости или частицы: (i) которому придается определенная форма или конструкция во время производства; (ii) функции конечного использования которого полностью или частично зависят от его формы или конструкции во время конечного использования; и (iii) который при нормальных условиях использования не выделяет более чем очень малых количеств, например незначительные или следовые количества опасного химического вещества (как определено в пункте (d) настоящего раздела), и не представляет физической опасности или риск для здоровья сотрудников.

Сплав  означает металлический материал, однородный в макроскопическом масштабе, состоящий из двух или более элементов, объединенных таким образом, что их нельзя легко разделить механическими средствами. Сплавы считаются смесями для целей классификации по СГС.

СГС должна быть простой и прозрачной с четким разграничением между классами и категориями для обеспечения возможности самоклассификации.

При классификации опасностей учитываются только присущие веществам или смесям опасные свойства.Данные, используемые для классификации, могут быть получены из тестов, литературы и практического опыта.

Процесс начинается с определения соответствующей информации об опасности вещества или смеси; эта информация анализируется, и принимается решение о том, следует ли классифицировать вещество или смесь как опасные, и степень опасности.

Как классифицировать смеси для СГС:

  • Данные испытаний для этой смеси используются, когда они доступны
  • Если данных испытаний нет, можно применить принципы сопряжения.
    • Принципы объединения работают, беря имеющиеся данные испытаний для веществ и/или ингредиентов, составляющих смесь, и используя их для классификации смеси
  • Если данных об испытаниях не существует и принципы объединения не работают, то для каждой опасности в официальном справочнике СГС есть информация по оценке опасности смеси

Дополнительные соображения по тестированию

СГС не содержит требований к тестируемым веществам.Проводимые тесты должны проводиться научным и воспроизводимым образом.

Критерии определения опасностей для здоровья и окружающей среды не зависят от методов испытаний, что позволяет использовать различные подходы, если они являются научно обоснованными.

Методы испытаний для определения физической опасности, как правило, более четкие и указаны в СГС.

Одной из целей СГС является сокращение повторных испытаний и испытаний на животных, и он позволяет использовать данные испытаний, уже полученные для классификации химических веществ в существующих системах, при классификации тех же химических веществ для СГС.

Когда это создает конфликт между существующей системой и СГС, необходима экспертная оценка.

Кроме того, тесты, не требующие использования живых животных, предпочтительнее, чем те, в которых используются разумные живые экспериментальные животные.

Испытания на людях исключительно в целях выявления опасности, как правило, неприемлемы; тем не менее эпидемиологические данные и опыт воздействия химических веществ на человека следует учитывать при оценке опасности химических веществ для здоровья человека.

Важны качество и согласованность данных. Для некоторых классов опасности классификация осуществляется непосредственно, когда данные удовлетворяют критериям.

Для других классификация вещества или смеси производится на основе совокупности доказательств.

Существуют особые соображения по классификации смесей.

Некоторые вещества медленно реагируют с атмосферными газами, напр. кислород, двуокись углерода, водяной пар, с образованием различных веществ или очень медленно реагируют с другими ингредиентами смеси или самополимеризуются; однако количество веществ, образующихся в результате таких реакций, обычно достаточно низкое, чтобы не влиять на классификацию смеси.

Пороговые значения и пределы концентрации

Могут быть случаи, когда пороговые значения или пределы концентрации, используемые для неиспытанных смесей, основанные на опасности их компонентов, не отражают адекватно идентифицируемую опасность, которую представляет смесь. Если у классификатора есть информация о том, что опасность ингредиента будет очевидна ниже порогового значения или предела концентрации, тогда смесь следует классифицировать соответствующим образом.

И наоборот, если данные показывают, что опасность ингредиента не будет присутствовать на уровне выше порогового значения СГС, смесь может быть классифицирована в соответствии с этими данными.В таких случаях данные должны быть сохранены и доступны для использования значений, отличных от пороговых значений и пределов концентрации в соответствии с СГС.

2.2 Смеси | Классификация вещества

Заполните следующую таблицу:

Вещество

несмеси или смеси

Гетерогенная смесь

Однородная смесь

водопроводная вода

латунь (сплав меди и цинка)

бетон

алюминиевая фольга (тинфойл)

Кока-Кола

мыльная вода

черный чай

сахарная вода

детская молочная смесь

Решение пока недоступно.

Критерий энтропии для оценки числа кластеров в модели смеси

  • Эйткин, М., и Рубин, Д.Б. (1985), «Оценка и проверка гипотез в конечных моделях смеси», Журнал Королевского статистического общества, серия Б, 47 , 67–75.

    Google ученый

  • ЭЙТКИН, М., и ТАННИКЛИФФ УИЛСОН, Г. (1980), «Модели смесей, выбросы и алгоритм ЭМ», Технометрика, 22 , 325–332.

    Google ученый

  • AKAIKE, H. (1974), «Новый взгляд на модель статистической идентификации», IEEE Transactions on Automatic Control, 19 , 716–723.

    Google ученый

  • БЭНФИЛД, Дж. Д., и РАФТЕРИ, А. Е. (1993), «Гауссовская и негауссовская кластеризация на основе моделей», Biometrics, 49 , 803–821.

    Google ученый

  • БЕЗДЕК, Дж.C. (1981), Распознавание образов с помощью алгоритмов нечетких целевых функций , Нью-Йорк: Пленум.

    Google ученый

  • BOCK, HH (1985), «О тестах на существование классификации», Journal of Classification, 2 , 77–108.

    Google ученый

  • BOCK, HH (1989), «Вероятностные аспекты кластерного анализа», в Концептуальный и численный анализ данных , изд., О. Опиц, Springer-Verlag, Heidelberg, стр. 12–44.

    Google ученый

  • БОЗДОГАН, Х. (1990), «Об информационном показателе ковариационной сложности и его применении для оценки многомерных линейных моделей», Communications in Statistics, Theory and Methods, 19 , 221–278.

    Google ученый

  • БОЗДОГАН, Х. (1993), «Выбор количества кластеров компонентов в модели смеси с использованием нового критерия информационной сложности обратной информационной матрицы Фишера», в Информация и классификация , ред., O. Optiz, B. Lausen и R. Klar, Heidelberg: Springer-Verlag, стр. 40–54.

    Google ученый

  • БОЗДОГАН, Х., и СКЛАВ, С.Л. (1984), «Многовыборочный кластерный анализ с использованием информационного критерия Акаике», Анналы Института статистической математики, 36 , 163–180.

    Google ученый

  • БРАЙАНТ, П. Г. (1991), «Результаты большой выборки для методов кластеризации на основе оптимизации», Journal of Classification, 8 , 31–44.

    Google ученый

  • БРАЙАНТ, П. Г. (1993), «Об определении количества кластеров с использованием принципа MDL», неопубликованная рукопись.

  • БРАЙАНТ П.Г. и УИЛЬЯМСОН Дж.А. (1978), «Асимптотическое поведение оценок максимального правдоподобия классификации», Biometrika, 65 , 273–281.

    Google ученый

  • БРАЙАНТ П.Г. и УИЛЬЯМСОН Дж.А. (1986), «Максимальное правдоподобие и классификация: сравнение трех подходов», в Классификация как инструмент исследования , ред., В. Гол и М. Шадер, Северная Голландия, стр. 33–45.

  • CELEUX, G. (1986), «Тесты валидности в кластерном анализе с использованием вероятностного алгоритма учителя», COMPSTAT 90 , ред., Ф. де Антони, Н. Лауро и А. Рицци, Гейдельберг: Springer- Верлаг, стр. 163–169.

    Google ученый

  • СЕЛЕУС, Г.и GOVAERT, G. (1991), «Критерии кластеризации для дискретных данных и моделей скрытых классов », Journal of Classification, 8 , 157–176.

    Google ученый

  • CELEUX, G. и GOVAERT, G. (1993), «Сравнение смеси и максимальное правдоподобие классификации в кластерном анализе», Journal of Statistical Computation and Simulation, 47 , 127–146.

    Google ученый

  • КАТЛЕР, А.и WINDHAM, MP (1993), «Информационные функционалы достоверности для анализа смесей», Труды первой американо-японской конференции по границам статистического моделирования , под ред., Х. Боздоган, Амстердам: Kluwer, стр. 149–170.

    Google ученый

  • ДЕМПСТЕР А. П., ЛЭРД Н. М. и РУБИН Д. Б. (1977), «Максимальное правдоподобие по неполным данным с помощью алгоритма EM (с обсуждением)», Журнал Королевского статистического общества, серия B, 39 , 1–38.

    Google ученый

  • ГАНЕСАЛИНГАМ, С. (1989), «Классификация и смешанные подходы к кластеризации с помощью максимального правдоподобия», Applied Statistics, 38 , 455–466.

    Google ученый

  • HATHAWAY, RJ (1986), «Другая интерпретация алгоритма ЭМ для распределения смесей», Statistics and Probability Letters, 4 , 53–56.

    Google ученый

  • КЁЛЕР, А.Б. и Мерфри, Э. Х. (1988), «Сравнение критериев Акаике и Шварца для выбора порядка моделей», Applied Statistics, 37 , 187–195.

    Google ученый

  • MACQUEEN, J. (1967), «Some Methods for Classification and Analysis of Multivariate Observations», Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability , Eds., LM Le Cam and J. Neyman, Berkeley : University of California Press, Vol.1 стр. 281–297.

    Google ученый

  • МАКЛАХЛАН, Г. Дж. (1987), «О начальной загрузке статистики теста отношения правдоподобия для количества компонентов в нормальной смеси», Applied Statistics, 36 , 318–324.

    Google ученый

  • МАКЛАХЛАН, Г.Дж., и БАСФОРД, К.Е. (1988), Модели смесей, выводы и приложения к кластеризации , Нью-Йорк.Марсель Деккер.

    Google ученый

  • MARRIOTT, FHC (1975), «Разделение смесей нормальных распределений», Biometrics, 31 , 767–769.

    Google ученый

  • РИССАНЕН, Дж. (1989), Стохастическая сложность в статистических исследованиях , Тинек, Нью-Джерси: World Scientific.

    Google ученый

  • ШВАРЦ, Г.(1978), «Оценка размерности модели», Annals of Statistics, 6 , 461–464.

    Google ученый

  • СОРОМЕНО, Г. (1994), «Сравнение подходов к тестированию количества компонентов в конечной модели смеси», Вычислительная статистика, 9 , 65–78.

    Google ученый

  • ТИТТЕРИНГТОН, Д.М., СМИТ, А.Ф., и МАКОВ, У.Е. (1985), Статистический анализ распределений конечных смесей , Нью-Йорк: Wiley.

    Google ученый

  • WINDHAM, M.P., и CUTLER, A. (1992), «Информационные соотношения для проверки кластерного анализа», Journal of the American Statistical Association, 87 , 1188–1192.

    Google ученый

  • ВОЛЬФ, Дж. Х. (1970), «Группирование моделей с помощью многомерного анализа смесей», Многомерное поведенческое исследование, 5 , 329–350.

    Google ученый

  • ВУЛФ, Дж.H. (1971), «Исследование методом Монте-Карло выборочного распределения отношения правдоподобия для смесей мультинормальных распределений», Исследовательская деятельность военно-морского персонала США. Технический бюллетень STB 72-2 , Сан-Диего, Калифорния.

  • Границы | Модель смеси информативных областей классификации прожектора (SCIM): идентификация корковых областей, демонстрирующих различимые жирные паттерны в связанных с событием слуховых данных фМРТ

    1. Введение

    Анализ многовоксельных паттернов — это инструмент, который был разработан при анализе функциональной магнитно-резонансной томографии (фМРТ) при изучении данных, полученных в ходе когнитивных исследований.Этот подход имеет множество преимуществ по сравнению с традиционными стратегиями одномерного анализа, например, с общими линейными моделями (GLM, Friston et al., 1995) благодаря более высокой чувствительности (Norman et al., 2006). Информация из сравнительно слабых функциональных ЖИРНЫХ сигналов в одиночных вокселах накапливается для более различимых паттернов ЖИРНЫХ ответов, что может увеличить статистическую мощность (Kriegeskorte et al., 2006). Однако стандарт для оценки и интерпретации результатов этих многомерных анализов еще не установлен.Поскольку статистическая природа результатов многомерного анализа (например, точность классификации или площадь под ROC-кривой для классификационного анализа) отличается от результатов, полученных одномерным анализом (например, z-показатели, t-показатели, бета-значения), различные статистические тесты необходимо применять для различения статистически значимых результатов. В этой статье мы представляем алгоритм модели смеси информативных областей классификации прожекторов (SCIM), процедуру статистической оценки результатов многомерного анализа паттернов (MVPA), полученных из данных фМРТ, которая устойчива к выбору порога, но при этом менее затратна в вычислительном отношении по сравнению с обычно используемой случайной моделью. перестановочные тесты.

    Для идентификации областей коры, которые демонстрируют различимые ЖИРНЫЕ паттерны для контрастных условий, одним из методов является алгоритм классификации прожектора (Kriegeskorte et al., 2006). Локальные паттерны ответов BOLD в подмножествах пространственных данных сферической формы оцениваются в анализе классификации, в результате чего получаются трехмерные карты, представляющие локальный информационный контент о контрастирующих условиях, со значением эффективности классификации для каждого центрального вокселя прожектора.Чтобы отделить информативные области прожекторов от областей без информации, результаты классификации необходимо проверить на статистическую значимость. Для оценки результатов эффективности классификации использовались различные подходы.

    В некоторых исследованиях нейровизуализации результаты отдельных субъектов представляют второстепенный интерес по сравнению с анализом на уровне группы из-за высокой изменчивости среди людей. В этих случаях одним из подходов к извлечению информативных областей из анализа прожекторов являются воксельные t -тесты по субъектам для оценки эффективности классификации в зависимости от уровня случайности (Bode and Haynes, 2009; Kahnt et al., 2010; Карлин и др., 2012). Поскольку в большинстве исследований количество испытуемых и, следовательно, выборок на тест ограничено небольшим числом, этот подход к информационным измерениям часто подвергался критике (Brodersen et al., 2013; Stelzer et al., 2013; Allefeld et al., 2016).

    При нулевой гипотезе о том, что классификатор не может найти информацию о различиях между двумя состояниями в данных BOLD для основных когнитивных задач, классификацию этих данных можно смоделировать как испытание Бернулли, что приведет к биномиальному распределению для n независимых тестов, требует независимости испытаний (Pereira et al., 2009). Биномиальный критерий использовался в нескольких исследованиях фМРТ (Oosterhof et al., 2010; Abrams et al., 2012; Akama et al., 2012, 2014). Однако большинство исследований фМРТ MVPA компенсируют небольшое количество испытаний, доступных на одного субъекта, перекрестной проверкой в ​​классификационном анализе, нарушая независимость испытаний в анализе, что приводит к слишком оптимистичным результатам статистической оценки с помощью биномиального теста. Тест случайной перестановки часто используется как альтернатива биномиальным тестам (Allefeld and Haynes, 2014; Hausfeld et al., 2014; Arsenault and Buchsbaum, 2015), мотивированные несколькими предположениями о требуемых данных (Pereira et al., 2009; Pereira and Botvinick, 2011; Stelzer et al., 2013; Allefeld et al., 2016). В предположении, что выборки данных не зависят от меток классов, нулевая гипотеза предполагает, что исходная эффективность классификации будет получена из распределения, полученного путем повторения классификационного анализа со случайно переставленными метками классов. Вероятность нулевой гипотезы, соответственно, p -значения определяется количеством перестановок, которые приводят к такой же высокой или более высокой эффективности классификации, чем исходный анализ.Однако наименьшее значение p , которое может быть достигнуто, равно единице, деленной на число повторений. Из-за высокой размерности данных фМРТ эти тесты требуют больших вычислительных ресурсов.

    Вместо того, чтобы искусственно создавать распределение значений производительности классификации, полученных при классификации неинформативных объемов прожектора путем перестановки меток классов, мы предлагаем использовать предположение, что для когнитивных задач будут задействованы только определенные области мозга, а большие корковые регионы остаются незатронутыми.Распределение значений эффективности классификации, полученных из всех областей мозга прожекторов, можно затем разложить на неинформативное распределение прожекторов и информативное распределение прожекторов с двухкомпонентной гауссовой смешанной моделью (GMM, Dempster et al., 1977), предполагая, что гауссовский характер подраспределения из-за высокой размерности числа прожекторов (около 10 5 прожекторов/вокселей соответственно). В масс-одномерном анализе фМРТ аналогичные подходы применялись для разложения активированных распределений вокселей и неактивированных распределений вокселов с использованием, например.g., основная частота мощности для разложения (Everitt and Bullmore, 1999; Hartvig and Jensen, 2000; Vincent et al., 2010) или кластеров активации (Penny and Friston, 2003; Kim et al., 2010; Oikonomou and Blekas, 2013). ). Пендзе и др. (2009) использовали для этой цели модели трехкомпонентной гауссовой смеси — в дополнение к неактивированному и активированному распределению, и они предположили, что деактивированное распределение с пониженным откликом BOLD для конкретных условий. Учитывая ненаправленный характер результатов классификации, мы предлагаем применять двухкомпонентную GMM для результатов MVPA.

    Надежная и устойчивая статистическая оценка приобретает все большее значение для исследования довольно сложных и абстрактных когнитивных задач, например, семантической интерпретации при прослушивании устной речи. Таким образом, мы показываем применимость предлагаемого метода не только на данных искусственного моделирования, но и на данных слухового исследования фМРТ, исследуя различия в областях коры, участвующих в обработке семантически достоверных речевых высказываний по сравнению с акустическим сигналом, который физически идентичен звуковому сигналу. нормальная речь, но без всякого смыслового содержания.Количество литературы, посвященной обработке речи людьми, указывает на важность этой темы для исследований человеческого общения. Исследования варьируются от очень фундаментальных задач, таких как восприятие высоты звука или гласных (Liebenthal et al., 2005; Uppenkamp et al., 2006; Formisano et al., 2008) и распознавания речи, до более абстрактных задач, таких как распознавание фонем и, наконец, семантическая интерпретация на лексический уровень слова (LoCasto et al., 2004; Handjaras et al., 2016) и уровень предложения (Friederici et al., 2000). Тем не менее, абстрактные задачи требуют очень тщательного планирования исследования, и необходимы дополнительные исследования для получения надежных результатов, позволяющих понять основы человеческого общения.

    Сравнение предлагаемого метода SCIM с биномиальным тестом показывает высокую устойчивость SCIM к выбору порога, что приводит к результатам, аналогичным результатам, полученным с помощью часто предлагаемого теста перестановки. Однако вычислительные затраты значительно снижаются, что позволяет увеличить количество сравнений условий и лучше понять когнитивные процессы.

    2. Методы

    2.1. Архитектура алгоритма

    Предлагаемый алгоритм вычисляет для каждого вокселя апостериорную вероятность того, насколько вероятно, что небольшой объем мозга, окружающий этот воксель, передает информацию об условиях эксперимента. Полученная трехмерная карта вероятностей впоследствии называется картой информативной области (IRM). На рис. 1 представлен обзор основных шагов алгоритма, подробно описанных в последующих разделах.

    Рисунок 1 . Предлагаемая процедура алгоритма информативной области классификации прожекторов (SCIM). После классификации данных фМРТ с помощью алгоритма прожектора полученные значения производительности площади под кривой (AUC) пространственно сглаживаются и разлагаются на неинформативное и информативное распределение прожектора с использованием двухкомпонентного GMM. Прожекторы с апостериорной вероятностью для информативного распределения выше порога, эквивалентного неинформативному распределению апостериорно ниже порога, определяют карту информативной области (IRM).

    Апостериорные вероятности вычисляются на основе двухкомпонентной гауссовой смешанной модели, которая моделирует распределение точности декодирования (значения площади под кривой, AUC) по позициям пространственного анализа. Декодирование выполняется с использованием прожекторной классификации с линейными машинами опорных векторов (SVM), из которых получается точность классификации для каждой позиции вокселя, усредненная по всем предъявлениям стимулов.

    2.2. Информативность и неинформативность смешанной модели регионов

    Мы предполагаем, что объемы мозга, содержащие результаты анализа с помощью прожекторов, можно разделить на две группы: (1) прожекторы, несущие информацию о контрасте условий, и (2) прожекторы, не содержащие этой информации.Ожидается, что эффективность классификации первого будет в среднем выше, чем случайный уровень, хотя она может значительно колебаться в зависимости от объема информативного прожектора. Вместо этого эффективность классификации, связанная с неинформативными объемами прожекторов, обязательно колеблется вокруг уровня случайности.

    Чтобы построить генеративную вероятностную модель, отражающую разнообразие наблюдаемых характеристик классификатора в двух группах, мы принимаем двухкомпонентную гауссовскую смешанную модель, в которой один смешанный компонент моделирует неинформативное распределение прожекторов, а второй компонент моделирует информативное распределение.

    Распределения компонентов для значений характеристик площади под кривой (AUC) прожектора, показанные на рисунке 2, для информативного (NI, синий) и неинформативного (NN, красный) компонентов вычисляются на основе гистограммы AUC всего мозга с использованием математического ожидания -алгоритм максимизации (EM) (Dempster et al., 1977). Базовая модель смеси связывает распределения компонентов с совместным распределением P (черный) в соответствии с

    . P(ρk|µI,µN,σI,σN,πI,πn)=πINI(ρk)+πNNN(ρk)=πIN(ρk|µI,σI)+πNN(ρk|µN,σN),    (1)

    , где ρ k – эффективность классификации AUC, достигнутая k -м SVM-классификатором, работающим на k -м прожекторном объеме.Предполагаемые значения предварительных вероятностей π I , π , π n , распределение μ I , μ N и стандартные отклонения Σ I , Σ N получаются из последующих итераций шага ожидания (E-шага) и шага максимизации (M-шага) EM-алгоритма, который максимизирует логарифмическую функцию правдоподобия

    Рисунок 2 . На гистограмму значений площади прожектора под кривой (AUC) в примере карты из анализа результатов одного субъекта накладывается соответствующий GMM и соответствующие информативные и неинформативные распределения прожекторов.Кроме того, отображаются средние значения и дисперсии распределений как основы показателей для критериев разделения.

    lnP({ρk}k=1K|µI,µN,σI,σN,πI,πn)=∑k=1Kln {πIN(ρk|µI,σI)+πNN(ρk|µN,σN)}. (2)

    апостериорная вероятность того, что k -й прожектор принадлежит подмножеству CI информативных объемов прожекторов, определяется как,

    p(k информативность|ρk)≡p(CI|ρk)=p(CI)p(ρk|CI)p(CI)p(ρk|CI)+p(CN)p(ρk|CN)=πIN(ρk |µI,σI)πIN(ρk|µI,σI)+πNN(ρk|µN,σN). (3)

    И наоборот, вероятность того, что k принадлежат подмножеству CN неинформативных объемов прожекторов, равна

    pSCIM(k)≡p(k неинформативный|ρk)=p(CN|ρk)=πNN(ρk|µN,σN)πIN(ρk|µI,σI)+πNN(ρk|µN,σN) =1− p(CI|ρk).(4)

    Последняя величина, p SCIM , используется на протяжении всей рукописи, поскольку она облегчает сравнение с классическим p -значением эталонных методов, которое обозначает вероятность принятия нулевой гипотезы. Таким образом, прожекторные объемы с p SCIM ниже порога указывают на информативные прожекторные объемы и в своей совокупности составляют карту информативной области (IRM).

    2.3. Прожектор Классификация

    Алгоритм прожектора требует пространственного разделения набора данных на перекрывающиеся объемы прожектора почти сферической формы, центрированные вокруг каждого вокселя, центрального вокселя соответствующей сферы прожектора, с радиусом, равным трем вокселям.ЖИРНЫЕ активации вокселов в конкретном прожекторе охватывают многомерный вектор пространства признаков x , из которого следует предсказать соответствующую метку условия эксперимента y = ±1.

    После того, как все объемы прожекторов анализируются независимо друг от друга, результаты классификации сопоставляются с соответствующим центральным вокселем каждого прожектора, в результате чего получается трехмерная информационная карта (Kriegeskorte et al., 2006), которая отражает информацию передается в локальных жирных областях об экспериментальном контрасте.Информационные карты отражают информационный контент в локальных шаблонах BOLD на основе их разделимости в многомерном пространстве признаков. Абсолютная сила активации не важна для интерпретации.

    2.4. Машина опорных векторов

    Классификационный анализ был основан на машинном анализе линейных опорных векторов (SVM, Schölkopf and Smola, 2001), который является подходящим и надежным методом классификации для данных фМРТ (например, Misaki et al., 2010). Модель логистической регрессии в пилотных экспериментах привела к сопоставимым, но несколько более низким результатам классификации.SVM являются дискриминационными классификаторами, находящими разделяющую гиперплоскость в пространстве признаков с максимальным расстоянием до соответствующих образцов классов. Результирующая модель параметризуется оптимальным весовым вектором w * , который проецирует выборки данных x i ортогонально разделяющей гиперплоскости. Чтобы учесть перекрывающиеся распределения классов, линейное решение SVM с мягким запасом получается путем минимизации функции стоимости, которая включает член проекции wTxi, а также член регуляризации

    w*=argminw (12wTw+C∑i=1lmax(1−yiwTxi,0)2).(5)

    Во избежание переобучения параметр регуляризации C определяется из экспериментальных данных с помощью вложенной перекрестной проверки, в которой внутренний цикл перекрестной проверки используется для нахождения оптимального C посредством поиска по сетке, а внешний цикл перекрестной проверки используется неоднократно оценивает производительность классификатора на удерживаемых данных.

    2.5. Анализ площади под кривой (AUC)

    Эффективность классификатора в каждом пространственном положении прожектора измеряется как площадь под кривой (AUC), величина, которая не зависит от конкретного порогового значения классификатора, поскольку она вычисляется путем интегрирования площади под кривой рабочей характеристики приемника (ROC) процент истинно- и ложноположительных результатов.Было показано, что AUC обеспечивает надежную меру производительности с выгодными свойствами в ряде задач классификации, что подтверждается, например, Брэдли (1997), и может интерпретироваться как вероятность правильного решения классификатора в задаче попарного сравнения одного положительный и один отрицательный пример выбираются случайным образом из совокупности данных (Green and Swets, 1966). В ряде анализов, выполненных здесь (см. результаты), общая мера точности процента правильных классификаций используется в качестве альтернативы AUC для исследования влияния на общие результаты анализа системы SCIM.

    2.6. Пространственное сглаживание

    Чтобы уменьшить влияние индивидуальных анатомических различий между участниками и избежать разрушения потенциальной мелкозернистой структуры, которая может поддерживать классификацию, карты эффективности классификации были пространственно сглажены с помощью ядра Гаусса (FWHM 3 мм) вместо шага пространственного сглаживания во время предварительной оценки. обработки, как это принято в процедурах многомерного анализа.

    2.7. Метрики разделения информативных и неинформативных раздач

    Степень выполнения нашей гипотезы об основных информативных и неинформативных распределениях вокселов можно оценить путем разделения информативного распределения (среднее μ I , стандартное отклонение σ I ) и неинформативного распределения. информативное распределение (μ N , σ N ) после подгонки модели двухкомпонентной смеси к значениям характеристик AUC прожектора.Классическим показателем разделения двух нормальных распределений является индекс чувствительности, который равен

    . d’=µI-µN12(σI2+σN2). (6)

    Полученные значения d ′ включаются в качестве параметра выбора модели в процедуру перекрестной проверки для регуляризации.

    Мы отмечаем, что ряд критериев разделения оценивались как альтернативы индексу чувствительности, включая несколько мер, основанных на среднем и дисперсии, перекрытии геометрического распределения и дивергенции Кульбака-Лейблера.Соответствующие результаты не показали систематических различий с индексом чувствительности d ′.

    2.8. Базовые статистические тесты

    Предыдущие исследования применяли ряд различных статистических тестов для получения карт результатов с пороговыми значениями из многомерного анализа фМРТ, двумя широко используемыми тестами являются биномиальный тест (Oosterhof et al., 2010; Abrams et al., 2012; Akama et al., 2012). ) и тест случайной перестановки (Allefeld and Haynes, 2014; Hausfeld et al., 2014; Kumar et al., 2016).

    В биномиальном тесте p -значений вычисляются как вероятность n совпадений правильных классификаций в N испытаниях согласно уравнению (7), где p T априорная вероятность p F = 1 − p T вероятность нецелевого стимула,

    pbin(k)=(Nn) pTnpF(N−n).(7)

    Тест случайной перестановки основан на повторном применении всей процедуры классификации (см. классификацию прожекторов) к данным с независимыми от меток данными. В каждом из N r повторений метки целей перемешиваются случайным образом, чтобы имитировать независимость образцов и целей. p -значения последовательно получены из числа повторений n h , которые привели к равной или более высокой эффективности классификации, чем производительность, полученная из исходного (неперетасованного) набора данных, деленная на общее количество повторений повторения N r ,

    Прямое сравнение двух эталонных оценочных тестов можно найти у Stelzer et al.(2013).

    2.9. Речевые стимулы

    Целью настоящего исследования является выявление корковых структур, участвующих в семантической обработке речи. Для устранения неоднозначности одновременных физических и семантических различий стимулов, возникающих, например, при сопоставлении речи с шумом, мы использовали два набора стимулов, смысловую и несемантическую речь, которые характеризуются в основном идентичными акустическими свойствами, но отличаются только наличием или отсутствием семантическое значение.

    Несмысловые речевые высказывания были взяты из «Международного речевого тестового сигнала» (ISTS, Holube et al., 2010), изначально разработанного как тестовый сигнал для независимой от языка оценки слуховых аппаратов. ISTS состоит из речевого материала шести женщин, говорящих на разных родных языках (арабский, английский, французский, немецкий, китайский и испанский), каждая из которых читает текст на своем родном языке. Он был разделен на сегменты продолжительностью 100–600 мс, которые впоследствии были перестроены в псевдослучайном порядке для формирования непрерывного потока речевых высказываний.В результате ISTS генерирует восприятие бессмысленной речи, которая не содержит никаких семантически значимых утверждений.

    Семантические речевые стимулы — это предложения, выбранные случайным образом из Геттингенского теста предложений (Kollmeier and Wesselkamp, ​​1997), теста на разборчивость речи, состоящего из фонетически сбалансированных предложений, каждое из которых передает короткое семантически достоверное утверждение. Чтобы добиться перцептивной сопоставимости с ISTS, мужской голос теста предложения был преобразован в воспринимаемый женский голос путем смещения высоты тона и цифрового изменения голосового тракта с использованием метода тандемной прямой (Kawahara and Morise, 2011).

    2.10. Сбор данных

    Данные

    FMRI были записаны на МРТ-сканере 3T Siemens. В исследовании приняли участие 19 человек (11 мужчин, 8 женщин, возраст 23,5 ± 2,6 года), 18 из них с немецким языком в качестве родного. Последние участники были рассмотрены для дальнейшего анализа данных. Все испытуемые участвовали добровольно с компенсацией расходов.

    Испытуемым предъявлялись семантические и несемантические речевые стимулы, как описано выше, в парадигме пассивного слушания.Был использован дизайн разреженной визуализации со временем повторения (TR) 9 с, включая 6,1 с звукового представления, за которым следовали 2,9 с сбора данных последовательности EPI для полного объема мозга в 21 срезе с размером вокселя 3,125 × 3,125 × 3,9 мм, поле зрения 20×20 см, размер матрицы 64×64 и время эха (ВЭ) 55 мс. Разреженное изображение позволяет разделить представление слуховых стимулов и шума сканера во времени. Кроме того, уменьшается временное перекрытие измеренных ответов BOLD на разные стимулы, что оказалось преимуществом для экспериментов со слуховой фМРТ (Edmister et al., 1999; Hall et al., 1999), а также является большим преимуществом для классификационного анализа фМРТ. Мы отмечаем, что семантические и не семантические пробные условия чередовались с пятью дополнительными акустическими стимулирующими условиями, анализ которых выходит за рамки текущего объема и будет сообщен в последующей публикации. Одна сессия длилась 50 минут, включая четыре прогона по 70 испытаний (по 10 испытаний на каждое условие). Для каждого участника было записано Т1-взвешенное анатомическое изображение, позволяющее определить локализацию результирующих активных областей мозга.Предварительная обработка, включая коррекцию движения временных рядов фМРТ, перенастройку и нормализацию к стандартному мозгу MNI, выполнялась с помощью программного обеспечения SPM8 (Friston et al., 1995).

    2.11. Данные моделирования

    Было создано десять наборов данных моделирования, чтобы оценить, насколько точно предлагаемый метод SCIM и эталонные методы могут идентифицировать области в наборе данных, которые были обработаны информацией о местоположении о различных условиях в определенных местах. Эти пространственные местоположения определяют шаблонную карту, которая сравнивается с картами результатов, полученными с помощью различных методов оценки.

    Всего было смоделировано 80 экспериментальных испытаний, по 40 на каждое целевое и нецелевое состояние, которые несли информацию об экспериментальном состоянии только в пределах пространственно ограниченной области шаблонной маски, напоминающей карту информативной области метода SCIM от одного субъекта. В областях вокселей за пределами маски-шаблона смоделированные активации вокселей генерировались случайным образом из нормального распределения со средним значением и дисперсией по вокселям, которые были идентичны среднему и дисперсии, вычисленным по всем экспериментальным данным фМРТ в целевом и нецелевом состоянии.Для вокселов в области шаблонной маски среднее значение и дисперсия по классам вокселей были идентичны средним значениям и дисперсии, рассчитанным для всех экспериментальных данных фМРТ, рассчитанных отдельно для целевого и нецелевого состояния, соответственно. Полученные активации вокселов нормального распределения в области маски шаблона были пространственно сглажены с помощью ядра Гаусса, полная ширина-полу-максимум 3 мм, чтобы смоделировать зависимости между соседними вокселами.

    2.12. Анализ на уровне группы

    Для всех трех рассматриваемых методов анализа, SCIM, теста перестановки и биномиального теста, групповые результаты получаются путем объединения значений производительности классификации отдельно для каждой позиции вокселя.

    Для метода SCIM результаты эффективности классификации усредняются по субъектам, в результате чего получается одна карта, представляющая для каждого вокселя среднее значение эффективности классификации. Затем распределение усредненных значений производительности разлагается на неинформативное и информативное распределение прожекторов, аналогично анализу одного субъекта, в результате чего получаются апостериорных вероятностей для неинформативного распределения прожекторов, которые сопоставимы с p – значения других методов статистической оценки.

    Результаты тестовой группы перестановок рассчитываются аналогично методу, предложенному в Stelzer et al. (2013). Значения производительности классификации усредняются по вокселям. Для каждого субъекта выполняется набор из r = 100 повторений анализа с рандомизированными метками, а результаты выполнения классификации сохраняются в r отдельных картах для каждого субъекта. В последующем воксельном анализе выбирается одна случайная выборка из набора х выборок для каждого субъекта, и соответствующая эффективность классификации в пространственном положении усредняется по субъектам.Эта процедура повторяется 100 000 раз, в результате чего получается нуль-распределение, содержащее 100 000 отсчетов на воксель. Результирующее значение p rp вычисляется как количество выборок в этом нулевом распределении, которые выше или равны исходной средней эффективности классификации, деленное на количество испытаний (100 000).

    Для биномиального теста количество правильных выборок на прожектор/воксель суммируется по вокселям. Теперь предположение для одного субъекта о том, что вероятность нулевой гипотезы равна биномиальной вероятности для n правильных классификаций в N выборках, адаптируется к сумме всех правильных классификаций ∑ n m в M × N выборок при размере группы M испытуемых, при n m количество правильных классификаций по данным испытуемых m .Результирующее значение p bin определяется как

    pbin=(M×N∑нм) pT∑нм pF(M×N−∑нм). (9)

    3. Результаты

    3.1. Моделирование

    Надежность модели смеси информативных областей классификации прожекторов (SCIM) была проверена с помощью классификационного анализа смоделированных данных. Мы сравнивали карты информативных областей (IRM), полученные в результате анализа методом SCIM, с картами прожекторной классификации с последующим биномиальным тестом, тестом случайной перестановки ( n = 100 повторений) и с шаблонной картой, лежащей в основе данных моделирования.

    Было проведено десять повторений анализа данных моделирования с использованием процедур, идентичных тем, которые использовались для экспериментальных данных фМРТ, включая сглаженные (рис. 3) и несглаженные AUC (рис. 4).

    Рисунок 3 . Результаты, полученные из смоделированных данных на сглаженных картах AUC. Шаблонная карта (A) для сравнения с картами результатов моделирования, полученными в результате анализа методом SCIM (B) , тестом случайной перестановки (C) и биномиальным тестом (D) пространственно сглаженных карт AUC.Из-за эффектов пространственного размытия, основанных на алгоритме прожектора, результаты, полученные всеми методами, показывают большую пространственную протяженность, чем карта-шаблон. Карта, основанная на анализе SCIM, наиболее похожа на карту-шаблон. Карта, полученная в результате теста случайной перестановки, показывает большие эффекты размытия, в то время как биномиальный тест приводит к информативным областям, которых нет в карте-шаблоне. Расположение поперечных срезов показано на сагиттальном срезе ( x = 0).

    Рисунок 4 .Результаты, полученные из смоделированных данных на несглаженных картах AUC. Карты результатов SCIM (B) сравнимы с картами, полученными с помощью пространственного сглаживания (рис. 3), в то время как в результатах теста перестановки (C) и в результатах биномиального теста (D) можно найти множество небольших информативных областей. которые не соответствуют шаблону карты (A) .

    На обоих рисунках показаны результаты одного прогона моделирования для метода SCIM, теста случайной перестановки и биномиального теста (красные карты), а также карты шаблона достоверности (голубая карта).После пространственного сглаживания карт AUC (рис. 3) данные моделирования, проанализированные с помощью метода SCIM и теста случайной перестановки, приводят к сопоставимым результатам. Информативные области, полученные с помощью этих методов, немного больше, чем в шаблонной карте, что можно объяснить алгоритмом прожектора, который пространственно размывает информацию, содержащуюся в вокселах, и дополнительным пространственным сглаживанием карт AUC после этапа классификации прожектора. Однако карта результатов теста случайной перестановки показывает небольшие дополнительные информативные области, которых нет на карте-шаблоне.Результаты, полученные с помощью биномиального метода, действительны только для высоких порогов значимости ( p < 0,01). Для несглаженных карт AUC (рис. 4) оба эталонных метода, тест случайной перестановки и биномиальный тест, демонстрируют информативные области, отсутствующие в шаблонной карте. Хотя эти ложноположительные результаты можно обработать с помощью пороговых значений кластера для результатов теста случайной перестановки, биномиальный тест приводит к неверным результатам. Результаты, полученные методом SCIM на несглаженных картах AUC, несколько менее чувствительны по сравнению с результатами, полученными на сглаженных картах AUC.Тем не менее, по сравнению с эталонными методами, метод SCIM лучше всего воспроизводит карту-шаблон.

    Перекрытие карт результатов моделирования и карты шаблона было определено как количество активных вокселов в картах шаблона и результатов по отношению к среднему общему количеству активных вокселей,

    Перекрытие=nt∩r0,5(nt+nr),    (10)

    с N R R R R R R R Количество вокселей, которые были активны в обоих картах, N T активные воксели в карте шаблона, и N R Active воксели на карте результатов.

    Статистическая оценка результатов моделирования подтверждает преимущество метода SCIM по сравнению с эталонными методами. Пространственное перекрытие IRM с базовой картой шаблона для различных порогов значимости показано на рисунке 5 с поправкой на частоту ложных открытий (FDR, Benjamini and Hochberg, 1995, панель A) и без поправки на множественные сравнения (панель B). Медианы для десяти повторений отображаются в виде линий, а межквартильный диапазон показан в виде полупрозрачной плоскости, однако он не виден из-за очень небольшой дисперсии между повторениями.Для низких пороговых значений p значения перекрытия сопоставимы для SCIM и биномиальных результатов, в то время как результаты теста случайной перестановки не включают информативных областей для очень низких p -значений из-за верхнего ограничения результирующих p rp – значения, ограниченные количеством повторений (pmin=1nrep). При увеличении пороговых значений перекрытие с результатами, полученными эталонными методами, значительно уменьшается, в то время как перекрытие результатов SCIM с картой шаблона остается практически постоянным.Несмотря на то, что p -значения, превышающие 0,05, мало применимы на практике, соответствующий диапазон результатов показан для значений до p =1, чтобы доказать надежность предложенного метода.

    Рисунок 5 . Перекрытие карт результатов моделирования с базовой картой истинности, полученной из анализа SCIM, теста случайной перестановки и биномиального теста для 10 повторений анализа моделирования и различных пороговых значений прикладной значимости p соответственно. (A) изображает результаты с коррекцией FDR, а (B) изображает результаты без поправки для множественного сравнения. Медианные значения для 10 повторений представлены в виде линий, межквартильные диапазоны отображаются в виде полупрозрачной плоскости, но не видны из-за очень небольшой дисперсии между повторениями. Для очень малых значений p результаты SCIM и биномиального теста показывают сравнимое перекрытие с картами наземной истинности. Однако перекрытие уменьшается для биномиальных результатов с увеличением значений p , в то время как результаты SCIM остаются почти постоянными.Карты результатов, полученные из теста случайной перестановки, показывают минимальные p -значения p rp = 0,01 (результаты из 100 повторений) и не показывают информативных областей для более низких пороговых значений p . Для p -значений выше 0,5 оба эталонных метода, критерий случайной перестановки и биномиальный критерий, ограничиваются дополнительным критерием AUC > 0,5 для прожекторов, чтобы быть информативными, а значения перекрытия сходятся к постоянному значению.Для результатов, полученных методом SCIM, это значение достигается при p -пороговое значение близко к 1.

    Чувствительность, специфичность и кривые ROC для различных методов изображены на рисунке 6 для карт результатов с поправкой на множественное сравнение и без нее. За исключением метода SCIM с несглаженными картами AUC, все методы достигают высокой чувствительности для значений p больше 0,01. Однако разница между специфичностью сглаженных и несглаженных карт в алгоритме SCIM сравнительно невелика.Специфичность критерия перестановки и биномиального критерия снижается сравнительно быстро для значений p больше 0,01. Кривые ROC для скорректированных тестов показывают благоприятный ход кривой теста перестановки со сглаженными картами AUC для p значений, превышающих 0,01. Однако для меньших значений p чувствительность теста перестановки равна нулю. Для несглаженных карт AUC ходы кривых можно разделить на две группы, где методы применяются соответственно к сглаженным и несглаженным картам.

    Рисунок 6 . Сравнение чувствительности (A,B) , специфичности (C,D) и ROC-кривых (E,F) для различных методов SCIM, перестановочного теста и биномиального теста. Все методы тестировались со сглаженными и несглаженными картами AUC. Результаты с коррекцией FDR показаны на левых панелях, а результаты без поправки на множественное сравнение — на правых панелях.

    3.2. Результаты по одному предмету

    В этом разделе представлен анализ результатов отдельных субъектов.Для пространственного распределения результатов классификационного анализа отдельные срезы из результатов одного субъекта отображаются для трех разных участников. Количественный анализ проводится по всем предметам.

    3.2.1. Пространственный
    P – Распределение значений

    На рисунке 7 показано пространственное распределение апостериорных вероятностей из анализа SCIM и p -значений из теста случайной перестановки и биномиального теста для одного среза (при z = 6 мм) для трех результаты по одному предмету.Прозрачные срезы располагаются на p = 0,05, отделяя информативные прожекторы от неинформативных для нескорректированных анализов. Анализ SCIM обеспечивает плато с высоким уровнем значимости для всех отображаемых результатов по одному предмету, в то время как неинформативные прожекторы соответствуют областям с уровнями значимости выше p = 0,4, которые не отображаются на графиках. Описанные ниже эффекты верны для всех срезов и всех предметов, графики ограничены одним срезом из трех предметов соответственно из-за нехватки места.

    Рисунок 7 . Пространственное распределение апостериорных вероятностей p SCIM (SCIM) и p -значений (тест случайной перестановки и биномиальный тест) на одном срезе ( z = 6 мм, один субъект, мера оценки AUC , пространственное сглаживание для SCIM, случайная перестановка и биномиальное) результатов одного испытуемого от трех разных испытуемых. (A) показывает результаты для субъекта 1, (B) показывает результаты для субъекта 2, а (C) показывает результаты для субъекта 3.Левые панели: распределение p SCIM -значений, полученных в результате смешанной модели информативной области классификации прожекторов (SCIM, полупрозрачная плоскость, расположенная в точке p SCIM = 0,05), имеет плато высокого уровня значимости для информативных областей прожектора. и низкий уровень шума в неинформативных областях. Центральные панели: p – значения, полученные в результате анализа случайных перестановок (полупрозрачная плоскость расположена на p perm = 0.05). Правые панели: распределение биномиального теста p -значений (полупрозрачная плоскость, расположенная в p бин = 0,05) показывает постепенный переход от информативных к неинформативным областям прожектора в узком интервале p -значений . Различия между информативными и неинформативными областями лучше всего очерчиваются с помощью метода SCIM и менее выражены с помощью методов случайной перестановки и биномиального метода.

    Информативные области, полученные в результате перестановочных тестов, преимущественно аналогичны полученным в результате SCIM-анализа, за исключением отдельных небольших информативных областей, встречающихся в результатах перестановочных тестов.Однако уровни значимости для информативных и неинформативных областей не так четко разделены, как в анализе SCIM, и наличие ранее упомянутых небольших информативных областей зависит от применяемых порогов значимости.

    Распределение p -значений, полученное в результате анализа биномиального критерия, показывает постепенный переход от информативных к неинформативным прожекторным областям в узком интервале p -значений. Это приводит к высокой зависимости информативных областей от применяемого порога значимости.

    3.2.2. Информативные карты регионов по одному предмету

    Отдельные срезы (при z = 6 мм) IRM, полученные при анализе одного субъекта, и соответствующее статистическое распределение результатов на всей карте результатов показаны на рисунке 8. Карты результатов, полученные с помощью метода SCIM, теста случайной перестановки и порог биномиального теста был равен 90 262 p 90 263 < 0,05 соответственно. Информативные области, полученные без коррекции на множественные сравнения, окрашены в красный цвет, соответствующие информативные области с коррекцией ФДР — в оранжевый.Результаты перестановочного теста показывают отсутствие информативных областей после коррекции ФДР для испытуемых 2 и 3, в то время как при других методах (а для испытуемой 1 также со случайной перестановкой) коррекция ФДР приводит к несколько уменьшению размеров информативных областей. Анатомические области, идентифицированные для участия в задаче семантической обработки, качественно одинаковы для всех методов. На правых панелях рисунка 8 показаны гистограммы значений эффективности классификации для всех мозговых прожекторов, предполагаемое нулевое распределение для метода SCIM (синяя линия) и соответствующие 90 262 апостериорных 90 263 вероятностей для значений эффективности классификации, полученных с помощью метода SCIM. .Черные точки показывают 90 262 p 90 263 значений, полученных из тестов случайной перестановки, а пунктирные линии показывают нуль-распределения для одного воксела с высокой (красный), средней (зеленый) и низкой (синий) эффективностью классификации соответственно. Нулевые распределения, полученные в результате теста случайной перестановки, сопоставимы для всех трех субъектов, в то время как исходное распределение значений AUC различается. Карты AUC, полученные в результате анализа данных от Испытуемого 1 (А), сдвинуты в сторону меньших значений, максимумы распределений от Испытуемого 2 (Б) и Испытуемого 3 (С) расположены на уровне шанса ( p шанс = 50%).Информативными считаются только прожекторы с AUC > 50%, а меньшее количество прожекторов, удовлетворяющих этому критерию, требует меньшего количества сравнений, подлежащих поправке в процедуре FDR. Следовательно, IRM с поправкой на FDR для Субъекта 1 сравнима с нескорректированной, в то время как IRM для Субъектов 2 и 3, с большим количеством прожекторов, связанных с распределением прожекторов с AUC > 50%, не показывают информативных областей после коррекции FDR. Темно-красные пунктирные линии показывают биномиальное распределение, полученное в результате дизайна исследования с N = 80 образцами и p шанс = 0.5. Это распределение также показывает 90 262 p 90 263 значений для выполненных результатов классификации, а также предполагаемое нулевое распределение для биномиального теста.

    Рисунок 8 . Одиночный срез (при z = 6 мм) карт предметной информативной области (IRM). (A) отображает результаты для субъекта 1, (B) показывает результаты для субъекта 2, а (C) показывает результаты для субъекта 3. IRM, полученные по результатам одного субъекта с помощью методов SCIM (первый столбец) , Критерий перестановки (второй столбец) и биномиальный критерий (третий столбец) для трех разных субъектов на уровне значимости p SCIM < 0.05, p rp < 0,05 и p bin < 0,05, без коррекции на множественное сравнение (красный) и с коррекцией ФДР (оранжевый) соответственно. Для испытуемых 2 и 3 при применении коррекции FDR информативных вокселей обнаружено не было. Для метода SCIM и биномиального метода карты, полученные с коррекцией FDR, имеют несколько меньшие информативные области. Правые панели показывают распределение результатов по вокселям. Гистограмма значений AUC представлена ​​в виде гистограммы.Отображаются апостериорные вероятности , полученные в результате анализа SCIM (красные кружки), и p -значения, полученные в результате теста перестановок (черные точки) и биномиального теста (темно-красная пунктирная линия), а также лежащие в основе предполагаемые нулевые распределения для различные тесты, метод SCIM (синяя линия) и тест перестановки с одним распределением для вокселя с высокой (синий), средней (зеленый) и низкой (красный) производительностью соответственно. Для субъекта 1 пики распределения для значений AUC ниже 50%, в то время как для других субъектов максимум находится на уровне вероятности AUC = 50%.

    3.2.3. Влияние порога значимости

    Количественный анализ результатов одного субъекта показан на рисунке 9. На левых панелях показана доля информативных прожекторов от всех прожекторов мозга для различных применяемых порогов значимости для трех методов оценки: (1) SCIM, (2) случайная перестановка и ( 3) показатели эффективности биномиального теста и классификации, AUC и точность. Линии представляют собой медиану по субъектам, а полупрозрачные области отображают межквартильный диапазон.Результаты анализа SCIM с поправкой на FDR примерно постоянны до пороговых уровней p = 0,1. При более высоких порогах количество информативных прожекторов увеличивается лишь незначительно. Количество информативных прожекторов, полученных в результате тестов случайной перестановки, различается у разных испытуемых. Для более высоких порогов, чем 90 262 p 90 263 = 0,05, верхний квартиль группы показывает сильно увеличивающееся количество информативных прожекторов с увеличением 90 262 p 90 263 -значения порогов, в то время как медиана группы показывает почти постоянный тренд, аналогичный результатам, полученным с метод СКИМ.

    Рисунок 9 . Количественный анализ отдельных предметных карт по предметам. (A,C) Совокупные гистограммы доли объемов прожекторов (в %, абсцисса), p SCIM -значение которых ниже выбранного порога p thr -значение (ордината), т.е. считается информативным. Кривые показывают медиану группы для метода SCIM, метода случайной перестановки и биномиального метода с измерениями площади под кривой (AUC) и точности (acc) соответственно.Полупрозрачные области отображают межквартильный диапазон. (B,D) Средние обратные наклоны кривых в (A,C) в интервале 0,05 > p thr > 0,01. (A,B) Показать скорректированные результаты FDR, (C,D) показать соответствующие нескорректированные результаты. Результаты показывают, что метод SCIM характеризуется сильным разделением информативных и неинформативных объемов прожектора, как для карт с поправкой FDR, так и для карт без поправки, в то время как результаты, полученные с измерением AUC и тестом случайной перестановки, сильно зависят от применяемых порогов.Результаты биномиального теста показывают эту зависимость во всех случаях.

    Поскольку прожекторы, дающие очень низкие результаты классификации, связаны с низкими p -значениями, но не должны обладать высокой информативностью, информативными считаются только прожекторы с более высокой эффективностью классификации, чем 50%. Этот дополнительный критерий является ограничивающим фактором для порогов около p rp = 0,5 для теста случайной перестановки и p бин = 0.08 для биномиального теста. Для более высоких порогов значимости все прожекторы с более высоким значением эффективности, чем 50%, считаются информативными, независимо от точных применяемых p пороговых значений.

    Соответствующие статистические данные для нескорректированных карт на нижней левой панели показывают сильную зависимость от примененных пороговых значений p как для показателей производительности, AUC и точности для биномиального теста, так и для показателя AUC для теста случайной перестановки. Результаты метода SCIM и результаты случайной перестановки, полученные в результате анализа точности, почти постоянны до p -значений 0.05. Количество информативных прожекторов, полученных в результате SCIM-анализа, медленно увеличивается для более высоких порогов, в то время как IRM, полученные в результате анализа случайных перестановок, показывают резкое увеличение количества прожекторов с увеличением p пороговых значений.

    Обычные пороговые значения p варьируются от p = 0,01 до p = 0,05 в разных исследованиях. Влияние различных применяемых порогов значимости представлено на правых панелях (B и D) рисунка 9 в виде обратного наклона медианных кривых на панелях A и C в диапазоне между p = 0.01 и р = 0,05 соответственно. Красные линии показывают медиану, прямоугольники — межквартильный размах, пунктирные линии — 5- и 95%-квантили, а красные крестики — выбросы. Для карт с поправкой на FDR (панель B) результаты SCIM показывают очень небольшие различия в этом диапазоне. Тесты случайной перестановки не приводят к информативности прожектора с коррекцией FDR, за исключением двух испытуемых, которые показывают большие различия в указанном диапазоне, чем результаты SCIM. Биномиальные тесты показывают большие различия между порогами, чем результаты как SCIM, так и случайной перестановки.Без поправки на множественные сравнения (панель D) обратные наклоны для результатов SCIM лишь незначительно отличаются от результатов, полученных с коррекцией FDR. Для теста случайной перестановки значений AUC абсолютное значение обратного наклона и, следовательно, изменение количества информативных прожекторов значительно больше, чем для анализа SCIM. Результаты, полученные с помощью меры точности, сопоставимы для анализа SCIM и тестов случайной перестановки. Результаты биномиального теста приводят к значительно большим абсолютным значениям обратных наклонов как для AUC, так и для измерения точности.

    3.3. Результаты группового уровня

    3.3.1. Краткое изложение методов оценки и мер классификации

    На рис. 10 показаны карты информативных областей (IRM) на уровне группы, полученные с помощью трех различных подходов: метода SCIM, теста случайной перестановки и биномиального теста. Информативные области, полученные с примененным p пороговым значением p < 0,05, окрашены в красный цвет, соответствующие информативные области для p < 0,01 темно-фиолетовым и p < 0.001 бледно-фиолетового цвета. Для измерений AUC (панель A) информативные области существенно не различаются для различных применяемых порогов и с коррекцией FDR или без нее, когда оценка значимости выполняется с помощью SCIM или теста случайной перестановки. Результаты биномиального теста показывают дополнительные информативные области к полученным двумя предыдущими методами в анатомических областях, которые не пересекаются с известными из литературы результатами для исследуемой когнитивной задачи как с коррекцией ФДР, так и без нее.Однако информативные области, полученные с помощью методов биномиального теста с порогом значимости ниже p = 0,01, аналогичны полученным двумя другими методами. Что касается показателей точности (панель B), IRM, полученные с помощью теста случайной перестановки и биномиального теста для пороговых значений p при p <0,05, включают информативные области в анатомических областях, которые не согласуются с областями, известными из литературы. Информативные области получены с порогами p < 0.01 согласуются с данными, полученными в результате анализа AUC и анализа SCIM.

    Рисунок 10 . Отдельные срезы ( z = 6 мм соответственно) групповых карт с мерой AUC (A) и мерой точности (B) . В первом и третьем столбцах показаны результаты с коррекцией FDR, во втором и четвертом столбцах — результаты без поправки на множественное сравнение. Групповые результаты, полученные с помощью предложенных методов SCIM, отображаются в первой строке, результаты теста случайной перестановки — во второй строке.Третья строка представляет результаты групп биномиального теста. Информативные участки на пороге с p < 0,05 окрашены в красный цвет, соответствующие результаты для порогов p < 0,01 — в темно-фиолетовый и p < 0,01 — в светло-фиолетовый.

    3.3.2. Уровень группы
    P – Распределение значений

    Пространственное распределение A-Poscorei Вероятность P P P P SCIM , полученные из анализа SCIM и P RP -Values ​​от случайной перестановки теста, а также P Bin 90 576 — значения биномиального теста отображаются для одного среза (90 262 z 90 263 = 6 мм) групповых карт результатов на рисунке 11.Другие фрагменты показывают аналогичные эффекты, но не показаны здесь из-за ограничений по размеру. Полупрозрачные срезы расположены на порогах p = 0,001. Информативные области, т. е. участки над полупрозрачной плоскостью, сопоставимы для результатов, полученных с помощью SCIM и теста случайной перестановки. Однако тест случайной перестановки показателей точности приводит к результатам чуть ниже порога, которые не так четко отделены от информативных областей по сравнению с результатами, полученными из показателей AUC или анализа SCIM для обоих показателей, AUC и точности. p бин -значения, полученные из биномиального теста, лежат в очень узком диапазоне значений, который не позволяет надежно отделить информативные области от неинформативных. В то время как другие методы, SCIM и тест случайной перестановки, показывают пространственно гладкие плато высокой значимости (соответственно низкие значения p ), результаты биномиального теста показывают очень однородное пространственное распределение как для AUC, так и для измерения точности.

    Рисунок 11 .Пространственное распределение апостериорных вероятностей p SCIM (SCIM) и p -значений (критерий случайной перестановки и биномиальный критерий) по одному срезу из карт групповых результатов [ z = 6 мм, групповые результаты , показатель оценки AUC (A–C) и точность (D–F) , пространственное сглаживание]. (A,D) Распределение p SCIM -значений, полученных в результате модели смеси информационных областей классификации прожектора (SCIM, полупрозрачная плоскость, расположенная на p SCIM = 0.001) имеет плато высокого уровня значимости для информативных прожекторных областей и низкий уровень шума в неинформативных областях. (B,E) P – значения, полученные в результате анализа случайных перестановок (полупрозрачная плоскость расположена на p perm = 0,001). (C,F) Распределение биномиального теста p -значений (полупрозрачная плоскость, расположенная в p бин = 0,001) в очень узком интервале p -значений. Различия между информативными и неинформативными областями лучше всего очерчиваются методом SCIM, однако они очень похожи на результаты, полученные в результате теста случайной перестановки.Для измерения точности тест случайной перестановки демонстрирует подпороговые неинформативные области, которые не так хорошо отделены от информативных областей по сравнению с картой результатов анализа AUC или анализа SCIM. Результаты, полученные биномиальным методом, практически не делятся на информативные и неинформативные области, так как диапазон возникающих p -значений очень мал.

    3.3.3. Статистическое распределение результатов группового уровня

    Распределение групповых результатов, полученных с помощью различных подходов, можно найти на рисунке 12 для показателя AUC (A) и показателя точности (B).Светло-голубые полосы отображают гистограмму соответствующих средних результатов классификации по всем предметам. Красные кружки показывают соответствующие 90 262 апостериорных 90 263 вероятностей, полученных с помощью метода SCIM, с меньшим количеством точек данных для меры точности из-за ограниченного разрешения 80 выборок на прожектор. Основные предполагаемые нулевые распределения для анализа SCIM показаны темно-синими линиями. Значения p rp , полученные в результате тестов случайной перестановки, отображаются в виде черных точек.По сравнению с результатами одного субъекта (см. рис. 8D), случайная перестановка групповых результатов p rp -значения показывают меньшую дисперсию для соответствующих показателей эффективности. Однако низкие значения p rp связаны с более низкими значениями эффективности классификации по сравнению с апостериорными вероятностями ( p SCIM ), полученными из анализов SCIM. Для биномиального теста предполагаемое распределение равно результирующим значениям p bin для соответствующих значений эффективности классификации.Они отображаются пунктирными темно-красными линиями. Для измерения AUC предполагаемое нулевое распределение из анализа SCIM и анализа случайной перестановки не достигает пика на ожидаемом уровне вероятности при p шанс = 0,5 в отличие от предполагаемого нулевого распределения для измерения точности. Однако, в то время как нулевое распределение SCIM определяется гистограммой значений AUC, нулевое распределение, полученное в результате тестов случайной перестановки, не соответствует гистограмме достигнутых значений AUC.С другой стороны, биномиальное нулевое распределение, которое зависит только от плана исследования, но не от результатов анализа, распределяется вокруг ожидаемого уровня вероятности. Для измерения точности все нулевые распределения сосредоточены вокруг уровня вероятности. Для обеих мер, AUC и точности, анализ SCIM обеспечивает более строгий отбор информативных областей на картах эффективности классификации, чем тест случайной перестановки и биномиальный тест.

    Рисунок 12 . Статистическая оценка групповых результатов на основе показателей (A) AUC и показателей точности (B) .Гистограммы показывают распределение результатов эффективности классификации, появляющихся на картах средних групп. Красные кружки показывают 90 262 апостериорных 90 263 вероятностей, полученных в результате анализа SCIM для соответствующих значений эффективности классификации, а синяя линия — лежащее в основе нулевое распределение. В тесте случайной перестановки значения p рассчитываются независимо для всех вокселей, которые показаны черными точками. p -значения, полученные с помощью биномиального теста, являются результатом биномиального распределения, которое также представляет предполагаемое нулевое распределение для этого теста.

    3.3.4. Информативные карты регионов на уровне группы

    На рисунке 13 показаны информативные области для контраста семантической речи и несмысловой речи, полученные в результате анализа фМРТ с помощью предлагаемого метода SCIM, основанного на показателе AUC (A), показателе точности (B) и соответствующих картах, полученных из обычно использовали тест случайной перестановки (C и D).

    Рисунок 13 . Карты групповых результатов для контраста семантической речи по сравнению с несемантической речью с предложенным методом SCIM на картах (A) AUC, картах точности (B) , тесте случайной перестановки на (C) AUC и (D) ) карт точности в пяти поперечных срезах и одном сагиттальном срезе для отображения местоположения поперечных срезов.Информативные области для групповых результатов, полученных с помощью теста случайной перестановки и метода SCIM на картах AUC, качественно согласованы, однако пространственная протяженность информативных областей из теста случайной перестановки несколько больше по сравнению с полученными при анализе методом SCIM. В то время как карты результатов SCIM, основанные на показателе точности, показывают пространственно меньшие информативные области с меньшей надежностью, соответствующие карты, полученные в результате теста случайной перестановки, кажутся слишком оптимистичными и приводят к неинтерпретируемым информативным областям.Для измерений AUC информативные области расположены в первичной и вторичной слуховой коре, а именно в извилине Хешля (HG) и верхней височной извилине (sts), а также в прилегающих областях, области Брока и области Вернике, которые ранее были связаны с обработкой речи. Дополнительные информативные области могут быть обнаружены за пределами височной коры, в передней и задней поясной извилине, ранее связанные с семантической обработкой.

    Информативные области, возникающие в результате предлагаемого метода (SCIM), в значительной степени перекрываются с областями, возникающими в результате теста случайной перестановки с мерой AUC, с немного большими информативными областями в результатах теста случайной перестановки.Расположение информативных областей, полученных из описанных анализов, находится в первичных слуховых и прилегающих областях в извилине Хешля и верхней височной извилине, в области Брока в области нижней лобной извилины и кзади от слуховой коры в области Вернике. Дополнительные информативные области для семантической обработки были обнаружены в лобно-кортикальных областях передней поясной извилины.

    Предыдущая статистическая оценка показала, что статистическая мощность биномиального теста значительно ниже, чем мощность метода SCIM и перестановочного теста.Следовательно, и для того, чтобы иметь возможность отображать несколько срезов реальных данных в пределах разумного пространства, карты результатов ориентированы на карты, полученные с помощью метода SCIM и теста перестановки. Соответствующие карты результатов, полученные в результате биномиального теста, можно найти в дополнительных материалах.

    4. Обсуждение

    В этой статье представлен новый метод оценки результатов, полученных в результате многофакторного классификационного анализа данных фМРТ с помощью прожектора. Данные моделирования и данные реального слухового эксперимента фМРТ анализируются с помощью предложенного метода SCIM, а результаты сравниваются с результатами, полученными с помощью двух эталонных методов, теста случайной перестановки и биномиального теста.Оценка и сравнение методов основаны на пространственном распределении полученных 90 262 p 90 263 -значений, надежности результатов для различных порогов значимости и мер классификации (AUC и точности) и согласованности с результатами, описанными в предыдущих исследованиях по изучению семантической обработки акустических стимулов. .

    4.1. Метод SCIM для

    апостериорной оценки вероятности

    Анализ данных моделирования в разделе 3.1 подтверждает общую применимость метода SCIM и преимущества перед эталонными методами, тестом случайной перестановки и биномиальным тестом, когда результаты сравниваются с достоверными данными.Все методы воспроизводят карту-шаблон для низких значений p с небольшими отличиями в зависимости от определенных этапов обработки, в частности пространственного сглаживания (см. рис. 5). Без пространственного сглаживания эталонные методы демонстрируют ложноположительные информативные области, не включенные в шаблонную карту, в то время как метод SCIM демонстрирует наибольшую согласованность с эталонной картой как для сглаженных, так и для несглаженных карт AUC с более низкой чувствительностью, но более высокой специфичностью для несглаженных карт. Как показано на рисунке 6, метод SCIM имеет низкую чувствительность при использовании без пространственного сглаживания карт AUC, и даже с пространственным сглаживанием чувствительность эталонных методов выше для p -значений, чем 0.01. Однако эти различия очень малы по сравнению с различиями в специфичности для p -значения > 0,01, где метод SCIM превосходит эталонные методы.

    Для экспериментальных данных все три метода успешно выделяют информативные области, что отражено в низких апостериорных вероятностях ( p SCIM ) для метода SCIM и низких p rp – и p бин – значения для методов случайной перестановки и биномиального метода соответственно.Однако обнаружено, что надежность пространственной протяженности карт информативных областей (IRM) по отношению к пороговому значению, применяемому во время анализа, зависит от выбора метода анализа. В то время как пространственная карта, полученная с помощью биномиального теста, сильно зависит от применяемого порога и приводит к неправдоподобным результатам для повышенных пороговых значений p (более низкие уровни значимости), тест анализа случайных перестановок более надежен, чем биномиальный тест при цена очень высоких вычислительных затрат.ИРМ, полученные методом СКИМ, характеризуются пространственно гладкими, низкими p СКИМ -значениями в информативных областях, четко отделенных от неинформативных, высокими p СКИМ -областями (см. рис. 7), и это разделение в значительной степени не зависит от выбранного порогового значения. Тот же эффект виден для групповых результатов, как показано на рисунках 13, 11, при сравнении результатов SCIM с тестом случайной перестановки. Для измерения AUC 90 262 апостериорных 90 263 вероятностей, полученных из группового анализа с помощью метода SCIM, сравнимы с таковыми, полученными из теста случайной перестановки, хотя вычислительная эффективность намного выше.Что касается меры точности, тест случайной перестановки не только связан с высокими вычислительными затратами, но и приводит к неинтерпретируемым результатам — в отличие от результатов SCIM, которые аналогичны результатам, полученным с помощью меры AUC, но с немного меньшими информативными областями.

    Зависимость от применяемых порогов количественно проиллюстрирована на рис. 9. Количество информативных прожекторов в ИРМ почти постоянно для апостериорных вероятностей меньших 0.1. В биномиальных картах результатов теста количество информативных прожекторов увеличивается в диапазоне обычно используемых порогов между p = 0,01 и p = 0,05. Тот же эффект можно наблюдать для карт результатов случайной перестановки, основанных на показателе AUC без коррекции FDR. Эти результаты подчеркивают необходимость исправления ложных открытий в картах результатов, возникающих в результате случайной перестановки и биномиальных тестов. Смещенные пороги оказывают небольшое влияние на результирующие информативные области IRM.В большинстве количественных сравнений метода SCIM с эталонными методами в этой статье показан диапазон значений до 90 262 p 90 263 = 1, хотя значения 90 262 p 90 263 > 0,05 имеют мало отношения к экспериментальным данным. Это было сделано, чтобы проиллюстрировать надежность метода SCIM. Учитывая устойчивость пространственных паттернов для больших значений p > 0,05, разумно ожидать очень устойчивых результатов для более низких вариантов p -значений (или, более конкретно: для более низких выбранных апостериорных уровней вероятности) .Следовательно, метод SCIM может предоставить инструмент для фМРТ-анализа, который в некоторой степени сохраняет чувствительность с повышенной специфичностью (Lieberman and Cunningham, 2009).

    В представленных здесь экспериментах и ​​имитациях наш анализ не смог выявить ситуации, в которых использование SCIM привело бы к значительным недостаткам по сравнению с эталонными методами. Методологические различия, например, лежащие в основе допущений методов и связанные с ними численные усилия, также не оказали негативного влияния на диапазон ситуаций, в которых применима SCIM.При сценарии p -значений больше 0,01 и одновременном акценте на высокой специфичности тест перестановки может быть предпочтительнее, когда его высокие вычислительные затраты не имеют значения. Однако этот сценарий имеет ограниченное значение для большинства исследований. Мы ожидаем, что будущие исследования будут способствовать более широкому пониманию качеств алгоритма.

    4.2. Сглаживание карт эффективности классификации

    Пространственное сглаживание влияет на результаты статистических тестов и оценки апостериорных вероятностей, поскольку оно по-разному изменяет базовое распределение AUC (и, соответственно, точность) в информативных и неинформативных областях мозга.Ожидается, что области с высокой пространственной непрерывностью, соответствующие сравнительно низкому стандартному отклонению, будут совпадать с информативными областями с высокой средней AUC и точностью соответственно. Дальнейшее сглаживание еще больше уменьшает их отклонение и, таким образом, уменьшает количество прожекторов в дальнем правом хвосте распределения, что было бы обнаружено с помощью фиксированного порога. Неинформативные области характеризуются меньшей пространственной непрерывностью, что приводит к сравнительно большему уменьшению стандартного отклонения, вызванному пространственным сглаживанием.Предлагаемый метод SCIM адаптивно отслеживает изменения в этих основных распределениях, поскольку модель двухкомпонентной гауссовской смеси адаптируется к информативным и неинформативным распределениям, которые подразумеваются наблюдаемыми данными, то есть сглаженным или несглаженным AUC и точностью. Пространственное сглаживание, примененное к методам случайной перестановки и биномиального эталона, имеет преимущественно эффект уменьшения пространственно «зашумленных» ложноположительных прожекторов (см. рис. 3, 4, третья и четвертая строки), однако иногда совпадая с уменьшением информативности карты.Более высокая чувствительность, которая может быть достигнута с помощью всех трех методов, также отражена на панелях A и B на рисунке 6 и ROC-кривых на панели F того же рисунка. Метод SCIM выигрывает от сглаживания, в частности, за счет включения дополнительных объемов прожектора в оценку информативной области с общим увеличением физиологического правдоподобия (см. рис. 3, 4, вторая строка).

    4.3. Показатель эффективности классификации

    Карты групповых результатов, полученные в результате анализа SCIM на рисунках 13A,B, отображают более информативные области, полученные в результате измерения AUC, чем в результате измерения точности, при этом первое обеспечивает лучшее совпадение пространственной протяженности физиологически релевантных для задачи областей, известных из литературы (см. .обсуждение физиологических результатов ниже). Надежность, оцениваемая как зависимость количества информативных прожекторов от примененных порогов, показанная на рисунке 9, сопоставима для обоих показателей эффективности в методе SCIM. Для тестов случайной перестановки результаты, основанные на точности, трудно интерпретировать и несовместимы с информативными областями, известными из литературы для задачи семантической обработки.

    Эти наблюдения, вероятно, отражают принципиальные преимущества меры AUC для оценки классификатора по сравнению с мерой точности.Было показано, что AUC обеспечивает меру производительности, которая инвариантна к априорным вероятностям класса и демонстрирует повышенную чувствительность и уменьшенную стандартную ошибку (Green and Swets, 1966; Spackman, 1989; Bradley, 1997). В контексте метода SCIM он предоставляет нам инструмент для надежной регуляризации и выбора модели на этапе обучения SVM и, таким образом, предотвращает переподгонку на этапе классификации прожектора. Информативное и неинформативное распределения, полученные на этапе GMM метода SCIM, характеризуются небольшим стандартным отклонением из-за эффективного «уменьшения шума» в мере AUC.Это облегчает разложение на информативное и неинформативное распределение прожекторов в методе SCIM и повышает надежность информативных областей в IRM.

    4.4. Физиологические результаты

    Анализы, представленные выше, постоянно обнаруживали информативные области мозга в областях слуховой коры, которые связаны с восприятием речи. В частности, мы определили верхнюю височную борозду (STS), которая, как было показано, играет роль в обработке речи в целом (Uppenkamp et al., 2006; Оснес и др., 2011; Markiewicz and Bohland, 2016) и обработки разборчивой речи в частности (Davis and Johnsrude, 2003; Abrams et al., 2012; McGettigan et al., 2012). Извилина Хешля, еще одна область мозга, отмеченная методом SCIM как информативная, ранее была связана с разной степенью четкости речи (Wild et al., 2012), восприятием гласных (Formisano et al., 2008), разборчивой речью (McGettigan et al. al., 2012) и слогов (Markiewicz, Bohland, 2016). В слуховых областях коры, связанных со слуховой обработкой более высокого порядка, области в нижней лобной борозде демонстрировали информативное содержание для семантического и семантического содержания.несмысловой речевой контраст. Ранее сообщалось, что они важны для семантической и фонологической обработки, подсчета слов и слогов (Poldrack et al., 1999), а также для иерархических структур и обработки предложений (Makuuchi et al., 2009), речевой рабочей памяти (Friederici et al., 2006) и обработки разборчивой речи (Abrams et al., 2012). В лобно-кортикальных областях анализы нашей группы показали надежные результаты в поясной извилине ( p SCIM < 0.001), что согласуется с выводами Аданка и Девлина (2010) для обработки слуховых предложений, а также для информации о гласных, связанной с выводом, Маркевичем и Бохландом (2016). В Rissmann et al. (2003), эта область показала более высокую активацию слов по сравнению с не-словами. Биндер и др. (2009) описали эту область в своем мета-анализе как интерфейс между системами семантического поиска и эпизодического кодирования.

    5. Заключение

    В этой работе исследовался новый метод оценки нейрофизиологических данных, который был протестирован на данных, полученных в ходе исследования слуховой фМРТ, при исследовании когнитивных процессов во время семантической обработки речи.Метод основан на анализе классификации прожектора с последующим разделением результатов прожектора на информативные и неинформативные области прожектора и позволяет более надежно различать информативные и неинформативные области коры, чем обычные методы оценки, такие как тесты случайной перестановки или биномиальный тест. Информативные области, полученные с помощью метода, качественно соответствуют таковым, полученным с помощью эталонных методов. Тем не менее, 90 262 апостериорных 90 263 вероятностей, полученных методом SCIM, распадаются на два отчетливо отдельных распределения, тогда как разделение значимых и незначимых результатов в эталонных методах сильно зависит от порога.Поскольку изменения в применяемых пороговых значениях изменяют результирующие карты информативных областей в меньшей степени, метод SCIM предоставляет инструмент оценки, который повышает специфичность многомерного анализа фМРТ без значительного ухудшения чувствительности. Этот метод применим ко всем исследованиям фМРТ, которые позволяют классифицировать ответы BOLD по отдельным классам задач или условий. Это полезно, в частности, для исследований фМРТ, в которых используются редкие изображения и набор данных довольно мал.Примеры данных, представленные в этом исследовании, показывают, что процедура позволяет надежно идентифицировать правдоподобные групповые эффекты, которые не были обнаружены при одномерном статистическом анализе.

    Заявление о доступности данных

    Необработанные данные, подтверждающие выводы этой статьи, будут предоставлены авторами без неоправданных оговорок.

    Заявление об этике

    Исследования с участием людей были рассмотрены и одобрены EK-2010/06/21, приложение DFG UP 10/2-2.Пациенты/участники предоставили письменное информированное согласие на участие в этом исследовании.

    Вклад авторов

    SU участвовал в разработке эксперимента фМРТ. AU и SU получили данные фМРТ. AU и JA проанализировали данные фМРТ и разработали предложенный метод. AU реализовал алгоритмы и анализы и написал первоначальную рукопись. JA предложил модель GMM и a-posteriori и написал разделы рукописи. Все авторы внесли свой вклад в доработку рукописи, прочитали и одобрили представленную версию.

    Финансирование

    Мы признательны за поддержку Deutsche Forschungsgemeinschaft (DFG, Немецкий исследовательский фонд) в рамках гранта SFB 1330/B3 №. 352015383, ДЛЯ 1732, SFB-TRR 31 и INST 184/157-1 FUGG.

    Конфликт интересов

    Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могли бы быть истолкованы как потенциальный конфликт интересов.

    Благодарности

    Сбор данных проводился в сотрудничестве с Мариной Имзике.AU выражает благодарность Бернду Т. Мейеру за редакционные комментарии к рукописи.

    Дополнительный материал

    Дополнительный материал к этой статье можно найти в Интернете по адресу: https://www.frontiersin.org/articles/10.3389/fnins.2020.616906/full#supplementary-material

    .

    Каталожные номера

    Абрамс Д. А., Риали С., Чен Т., Балабан Э., Левитин Д. Дж. и Менон В. (2012). Многовариантные паттерны активации и связи различают разборчивость речи в зонах Вернике, Брока и Гешвинда. Церебр. Кортекс 23, 1703–1714. doi: 10.1093/cercor/bhs165

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Аданк П. и Девлин Дж. Т. (2010). Он-лайн пластичность в понимании устных предложений: адаптация к сжатой во времени речи. Нейроизображение 49, 1124–1132. doi: 10.1016/j.neuroimage.2009.07.032

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Акама, Х., Мерфи, Б., Лей, М.М., и Поэзио, М. (2014).Моделирование с участием нескольких участников, основанное на выборе совместных или непересекающихся признаков: исследование концептуального декодирования фМРТ. Заяв. Сообщить . 1, 1–21. дои: 10.1186/2196-0089-1-1

    Полнотекстовая перекрестная ссылка | Академия Google

    Акама Х., Мерфи Б., На Л., Симидзу Ю. и Поэзио М. (2012). Семантика декодирования сеансов фМРТ с различными модальностями стимула: практическое исследование MVPA. Перед. Нейроинформ . 6:24. doi: 10.3389/fnif.2012.00024

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Аллефельд, К., Гёрген К. и Хейнс Дж.-Д. (2016). Достоверный вывод о популяции для визуализации на основе информации: от второго уровня t -теста до вывода о распространенности. Нейроизображение 141, 378–392. doi: 10.1016/j.neuroimage.2016.07.040

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Аллефельд, К., и Хейнс, Дж.-Д. (2014). Анализ многовоксельных паттернов фМРТ на основе прожектора с помощью перекрестной проверки MANOVA. Нейроизображение 89, 345–357. doi: 10.1016/j.нейроизображение.2013.11.043

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Арсено, Дж. С., и Буксбаум, Б. Р. (2015). Распределенные нейронные представления фонологических признаков при восприятии речи. Дж. Нейроски . 35, 634–642. doi: 10.1523/JNEUROSCI.2454-14.2015

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Бенджамини Ю. и Хохберг Ю. (1995). Управление частотой ложных открытий: практичный и мощный подход к множественному тестированию. JR Stat. соц. Б Методол . 57, 289–300. doi: 10.1111/j.2517-6161.1995.tb02031.x

    Полнотекстовая перекрестная ссылка | Академия Google

    Биндер, Дж. Р., Десаи, Р. Х., Грейвс, В. В., и Конант, Л. Л. (2009). Где семантическая система? Критический обзор и метаанализ 120 исследований функциональной нейровизуализации. Церебр. Кора 19, 2767–2796. doi: 10.1093/cercor/bhp055

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Брэдли, А.П. (1997). Использование площади под ROC-кривой при оценке алгоритмов машинного обучения. Распознавание образов . 30, 1145–1159. doi: 10.1016/S0031-3203(96)00142-2

    Полнотекстовая перекрестная ссылка | Академия Google

    Бродерсен, К. Х., Донизо, Дж., Матис, К., Чамбли, Дж. Р., Бухманн, Дж. М., и Стефан, К. Э. (2013). Вариационный байесовский вывод со смешанными эффектами для классификационных исследований. Нейроизображение 76, 345–361. doi: 10.1016/j.neuroimage.2013.03.008

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Карлин, Дж.Д., Роу Дж. Б., Кригескорте Н., Томпсон Р. и Колдер А. Дж. (2012). Коды, чувствительные к направлению, для наблюдаемых поворотов головы в верхней височной борозде человека. Церебр. Кортекс 22, 735–744. doi: 10.1093/cercor/bhr061

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Демпстер, А. П., Лэрд, Н. М., и Рубин, Д. Б. (1977). Максимальная вероятность из неполных данных с помощью алгоритма EM. JR Stat. соц. Б Методол . 39, 1–38. doi: 10.1111/j.2517-6161.1977.tb01600.x

    Полнотекстовая перекрестная ссылка | Академия Google

    Эдмистер, В. Б., Талавадж, Т. М., Ледден, П. Дж., и Вайскофф, Р. М. (1999). Улучшенная визуализация слуховой коры с использованием групповых объемных снимков. Гул. Карта мозга . 7, 89–97. doi: 10.1002/(SICI)1097-0193(1999)7:2<89::AID-HBM2>3.0.CO;2-N

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Эверитт, Б.С., и Буллмор, Э.Т. (1999). Картирование смешанной модели активации мозга в функциональных магнитно-резонансных изображениях. Гул. Карта мозга . 7, 1–14. doi: 10.1002/(SICI)1097-0193(1999)7:1<1::AID-HBM1>3.0.CO;2-H

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Формисано, Э., Де Мартино, Ф., Бонте, М., и Гебель, Р. (2008). «Кто» говорит «что»? Мозговое декодирование человеческого голоса и речи. Наука 322, 970–973. doi: 10.1126/science.1164318

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Фридеричи, А. Д., Фибах, К.Дж., Шлезевски М., Борнкессель И.Д. и фон Крамон Д.Ю. (2006). Обработка лингвистической сложности и грамматики в левой лобной коре. Церебр. Кортекс 16, 1709–1717. doi: 10.1093/cercor/bhj106

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Фридеричи, А.Д., Мейер, М., и фон Крамон, Д.Ю. (2000). Слуховое понимание языка: связанное с событиями исследование фМРТ обработки синтаксической и лексической информации. Брейн Ланг .74, 289–300. doi: 10.1006/brln.2000.2313

    Полнотекстовая перекрестная ссылка | Академия Google

    Фристон, К., К.Дж. Уорсли, А. Х., Полин, Дж.-П., Фрит, К., и Фраковяк, Р. (1995). Статистические параметрические карты в функциональной визуализации: общий линейный подход. Гул. Карта мозга . 2, 189–210. doi: 10.1002/hbm.460020402

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Грин, Д.М., и Светс, Дж.А. (1966). Теория обнаружения сигналов и психофизика .Нью-Йорк, штат Нью-Йорк: Уайли.

    Академия Google

    Hall, D.A., Haggard, M.P., Akeroyd, M.A., Palmer, A.R., Summereld, A.Q., Elliott, M.R., et al. (1999). «Разреженная» временная выборка в слуховой фМРТ. Гул. Карта мозга . 7, 213–223. doi: 10.1002/(SICI)1097-0193(1999)7:3<213::AID-HBM5>3.0.CO;2-N

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Ханджарас, Г., Риккарди, Э., Леоанд, А., Ленчи, А., Чеккетти, Л., Косоттини, М., и соавт.(2016). Как понятия кодируются в человеческом мозгу: независимая от модальности, основанная на категориях корковая организация семантических знаний. Нейроизображение 135, 232–242. doi: 10.1016/j.neuroimage.2016.04.063

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Хаусфельд Л., Валенте Г. и Формисано Э. (2014). Декодирование и визуализация мультиклассовых данных фМРТ с использованием контролируемых самоорганизующихся карт. Нейроизображение 96, 54–66. doi: 10.1016/j.neuroimage.2014.02.006

    Полнотекстовая перекрестная ссылка | Академия Google

    Холубе, И., Фределаке, С., Вламинг, М., и Коллмайер, Б. (2010). Разработка и анализ международного тестового речевого сигнала (ISTS). Междунар. Дж. Аудиол . 49, 891–903. дои: 10.3109/149.2010.506889

    Полнотекстовая перекрестная ссылка | Академия Google

    Кант, Т., Хайнцле, Дж., Парк, С.К., и Хейнс, Дж.Д. (2010). Нейронный код ожидания награды в орбитофронтальной коре человека. Проц.Натл. акад. науч. США . 107, 6010–6015. doi: 10.1073/pnas.08107

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Кавахара, Х., и Морис, М. (2011). Технические основы Tandem-STRAIGHT, системы анализа, модификации и синтеза речи. САДХАНА Академик. проц. англ. Наука . 36, 713–722. doi: 10.1007/s12046-011-0043-3

    Полнотекстовая перекрестная ссылка | Академия Google

    Ким, С., Смит, П., и Стерн, Х. (2010). Байесовский смешанный подход к моделированию пространственных паттернов активации в многосайтовых данных фМРТ. IEEE Trans. Мед. Визуализация 29, 1260–1274. doi: 10.1109/TMI.2010.2044045

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Коллмайер, Б., и Весселькамп, М. (1997). Разработка и оценка немецкого теста предложений для объективной и субъективной оценки разборчивости речи. Дж. Акуст. соц. Я . 102, 2412–2421. дои: 10.1121/1.419624

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Кумар, С., Джозеф, С., Гандер, П.Е., Бараскуд, Н., Халперн, А.Р., и Гриффитс, Т.Д. (2016). Система мозга для слуховой рабочей памяти. Дж. Нейроски . 36, 4492–4505. doi: 10.1523/JNEUROSCI.4341-14.2016

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Либенталь Э., Биндер Дж. Р., Спитцер С. М., Поссинг Э. Т. и Медлер Д. А. (2005). Нервные субстраты фонематического восприятия. Церебр. Кора 15, 1621–1631. doi: 10.1093/cercor/bhi040

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Либерман, М.Д. и Каннингем, Вашингтон (2009). Проблемы с ошибками типа I и типа II в исследованиях фМРТ: перебалансировка шкалы. Соц. Познан. Оказывать воздействие. Нейроски . 4, 423–428. doi: 10.1093/scan/nsp052

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    LoCasto, PC, Krebs-Noble, D., Gullapalli, R.P., и Burton, M.W. (2004). ФМРТ-исследование сегментации речи и тона. Дж. Когн. Нейроски . 16, 1612–1624. дои: 10.1162/089892

    68433

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Макуути, М., Бахлманн, Дж., Анвандер, А., и Фридеричи, А.Д. (2009). Отделение основной вычислительной способности человеческого языка от рабочей памяти. Проц. Натл. акад. науч. США . 106, 8362–8367. doi: 10.1073/pnas.0810

      6

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Маркевич, С. Дж., и Боланд, Дж. В. (2016). Картирование корковой репрезентации звуков речи в задаче на повторение слога. Нейроизображение 141, 174–190. doi: 10.1016/j.neuroimage.2016.07.023

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      МакГеттиган, К., Эванс, С., Розен, С., Агнью, З.К., Шах, П., и Скотт, С. (2012). Применение одномерных и многомерных подходов в фМРТ для количественной оценки полушарной латерализации акустических и лингвистических процессов. Дж. Когн. Нейроски . 24, 636–652. дои: 10.1162/jocn_a_00161

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Мисаки М., Ким Ю., Бандеттини, П., и Кригескорте, Н. (2010). Сравнение многомерных классификаторов и нормализации ответов для фМРТ с информацией о шаблонах. Нейроизображение 53, 103–118. doi: 10.1016/j.neuroimage.2010.05.051

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Норман, К. А., Полын, С. М., Детре, Г. Дж., и Хаксби, Дж. В. (2006). Помимо чтения мыслей: многовоксельный анализ данных фМРТ. Тенденции Cogn. Наука . 10, 424–430. doi: 10.1016/j.tics.2006.07.005

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Остерхоф, Н. Н., Виггетт, А. Дж., Дидрихсен, Дж., Типпер, С. П., и Даунинг, П. Е. (2010). Информационное картирование на основе поверхности выявляет кроссмодальные репрезентации зрения и действия в теменной и затылочно-височной коре головного мозга человека. Дж. Нейрофизиол . 104, 1077–1089. doi: 10.1152/jn.00326.2010

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Оснес Б., Хугдал К.и Шпехт, К. (2011). Эффективный анализ связности демонстрирует вовлечение премоторной коры во время восприятия речи. Нейроизображение 54, 2437–2445. doi: 10.1016/j.neuroimage.2010.09.078

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Пендсе, Г., Борсук, Д., и Бесерра, Л. (2009). Повышенная частота ложных обнаружений с использованием смешанных моделей Гаусса для пороговой обработки статистических карт фМРТ. Нейроизображение 47, 231–261. doi: 10.1016/j.neuroimage.2009.02.035

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Полдрак, Р. А., Вагнер, А. Д., Прулл, М. В., Десмонд, Дж. Э., Гловер, Г. Х., и Габриэли, Дж. Д. Е. (1999). Функциональная специализация семантической и фонологической обработки в левой нижней префронтальной коре. Нейроизображение 10, 15–35. doi: 10.1006/nimg.1999.0441

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Рисманн Дж., Элиассен Дж. К. и Блюмштейн С.Э. (2003). Связанное с событием исследование фМРТ неявного семантического прайминга. Дж. Когн. Нейроски . 15, 1160–1175. дои: 10.1162/089892

    1. 2598120

      Полнотекстовая перекрестная ссылка | Академия Google

      Шёлкопф, Б., и Смола, А. Дж. (2001). Обучение с помощью ядер: машины опорных векторов, регуляризация, оптимизация и не только . Кембридж, Массачусетс: MIT Press.

      Академия Google

      Спэкман, К.А. (1989). «Теория обнаружения сигналов: ценные инструменты для оценки индуктивного обучения», в материалах Шестого международного семинара по машинному обучению , изд.М. Сегре (Сан-Франциско, Калифорния: Морган Кауфманн), 160–163. doi: 10.1016/B978-1-55860-036-2.50047-3

      Полнотекстовая перекрестная ссылка | Академия Google

      Стельцер Дж., Чен Ю. и Тернер Р. (2013). Статистический вывод и коррекция множественного тестирования в анализе многовоксельных паттернов на основе классификации (MVPA): случайные перестановки и контроль размера кластера. Нейроизображение 65, 69–82. doi: 10.1016/j.neuroimage.2012.09.063

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Уппенкамп, С., Джонсруд И.С., Норрис Д., Марслен-Уилсон В. и Паттерсон Р.Д. (2006). Определение начальных стадий обработки речи и звука в височной коре человека. Нейроизображение 31, 1284–1296. doi: 10.1016/j.neuroimage.2006.01.004

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Винсент, Т., Риссер, Л., и Чучу, П. (2010). Моделирование пространственно-адаптивной смеси для анализа временных рядов фМРТ. IEEE Trans. Мед. Визуализация 29, 1059–1074. дои: 10.1109/ТМИ.2010.2042064

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Уайлд, С. Дж., Дэвис, М. Х., и Джонсруд, И. С. (2012). Слуховая кора человека чувствительна к воспринимаемой ясности речи. Нейроизображение 60, 1490–1502. doi: 10.1016/j.neuroimage.2012.01.035

      Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

      Какова правильная классификация смеси, в которой видны и твердое, и жидкое состояние?

      Однородная смесь Гетерогенная смесь
      Пример – (i) твердое-твердое – сплавы (ii) твердое-жидкое – раствор сахара, (iii) жидкое-жидкое – спирт и вода Примеры – (i) Твердое-твердое – Железо и сера (ii) Твердое-жидкое – Песок и вода (iii) Жидкое-жидкое – Нефть и вода

      Каковы 3 классификации смесей?

      Смеси можно разделить на три различных типа на основе размера частиц: растворы, суспензии и коллоиды .Компоненты смеси сохраняют свои физические свойства.

      Каковы две классификации материи?

      Материю можно разделить на несколько категорий. Двумя широкими категориями являются смеси и чистые вещества . Чистое вещество имеет постоянный состав. … Чистые вещества, которые нельзя разложить на более простые вещества путем химических превращений, называются элементами.

      Как мы классифицируем смесь?

      Смеси могут быть классифицированы как гомогенные или гетерогенные.Смеси состоят из веществ, не связанных химически. Однородные смеси являются растворами. Компоненты раствора равномерно распределены, так что все части раствора одинаковы.

      Что из следующего может быть классифицировано как смесь?

      Ответ на поставленный выше вопрос: (a) прозрачный раствор белой соли . Смесь образуется при физическом соединении двух или более веществ, которые можно легко разделить физическими методами.При образовании смеси не происходит никаких химических изменений. Растворы, коллоиды и суспензии представляют собой три типа смесей.

      Как можно классифицировать виды смесей по состоянию?

      Смеси можно разделить на три типа: суспензионная смесь, коллоидная смесь или раствор , в зависимости от того, как они объединяются и могут быть разделены. Суспензионные смеси имеют более крупные частицы растворенного вещества, коллоидные смеси имеют гораздо более мелкие частицы, а частицы в растворах полностью растворяются в растворителе.

      Как классифицируются газ и сжиженные газы?

      Жидкое вещество состоит из более рыхлых частиц. … Частицы могут перемещаться внутри жидкости, но они упакованы достаточно плотно, чтобы сохранить объем. Газообразное вещество состоит из частиц, упакованных настолько рыхло, что не имеет ни определенной формы, ни определенного объема. Газ можно сжать.

      Как можно разделить растворы на твердые жидкие и газообразные формы?

      2 показывает различия между твердыми телами, жидкостями и газами на молекулярном уровне.Твердое тело имеет определенный объем и форму , жидкость имеет определенный объем, но не имеет определенной формы, а газ не имеет ни определенного объема, ни формы.

      Что такое газовая смесь?

      Одним из свойств газов является то, что они смешиваются друг с другом . … В газовых смесях каждый компонент газовой фазы можно обрабатывать отдельно. Каждый компонент смеси имеет одинаковые температуру и объем. (Помните, что газы расширяются, чтобы заполнить объем своего контейнера; газы в смеси также делают это.)

      Что такое гомогенная и гетерогенная смесь?

      Гомогенная смесь — это такая смесь , в которой компоненты смешиваются друг с другом и ее состав однороден по всему раствору . Гетерогенная смесь – это такая смесь, в которой состав не везде однороден и наблюдаются разные компоненты.

      Что такое гомогенная и гетерогенная смесь на примере?

      Смесь образуется путем соединения двух или более материалов. Однородная смесь кажется однородной, независимо от того, где вы ее пробуете.… Примеры однородных смесей включают воздух, солевой раствор, большинство сплавов и битум. Примеры гетерогенных смесей включают песок, масло и воду и куриный суп с лапшой .

      Какой тип смеси считается гетерогенной смесью?

      Гетерогенные смеси

      Гетерогенная смесь — это смесь, состав которой неоднороден по всей смеси . Овощной суп представляет собой неоднородную смесь. Любая данная ложка супа будет содержать различное количество различных овощей и других компонентов супа.

      Какие существуют 4 типа смесей?

      СМЕСИ? вместе. Четыре, если быть точным, называются РАСТВОРЫ, СУСПЕНЗИИ, КОЛЛОИДЫ и ЭМУЛЬСИИ .

      Какой тип смеси образуется при смешивании твердого материала с другим твердым материалом?

      Когда твердый материал

      называется гетерогенной смесью .

      Что из перечисленного можно отнести к гомогенной смеси?

      Ответ: Соленая вода будет считаться гомогенной смесью.

      Что такое материя и классификация материи?

      Вещество можно классифицировать по физическим и химическим свойствам. Материя — это все, что занимает пространство и имеет массу . Три состояния вещества – твердое, жидкое и газообразное. Физическое изменение предполагает переход вещества из одного состояния вещества в другое без изменения его химического состава.

      Сколько типов материи можно классифицировать, объясняя оба этих случая?

      три состояния материи — это три различные физические формы, которые материя может принимать в большинстве сред: твердая, жидкая и газообразная.В экстремальных условиях могут присутствовать другие состояния, такие как плазма, конденсат Бозе-Эйнштейна и нейтронные звезды.

      Каковы два 2 класса ответа материи?

      Материю можно разделить на две категории: чистые вещества и смеси . Чистые вещества далее разлагаются на элементы и соединения. Смеси представляют собой физически объединенные структуры, которые можно разделить на исходные компоненты. Химическое вещество состоит из одного типа атома или молекулы.

      Является ли тип смеси, в которой твердые или жидкие частицы равномерно распределены по объему жидкого или твердого газа, подразделяется на четыре типа?

      Коллоиды
      Коллоиды представляют собой смеси, в которых одно или несколько веществ диспергированы в виде относительно крупных твердых частиц или капель жидкости в твердой, жидкой или газообразной среде.

      Как вы классифицируете материю как смесь или чистое вещество?

      Чистое вещество — это форма материи, имеющая постоянный состав и свойства, которые неизменны во всем образце .Смеси представляют собой физические комбинации двух или более элементов и/или соединений. Смеси можно разделить на гомогенные и гетерогенные.

      Какова классификация чистого вещества?

      Чистые вещества далее классифицируются как элементы и соединения . Элемент – это вещество, состоящее только из атомов одного типа или вида. Элемент — это чистое вещество, поскольку его нельзя разложить или превратить в новое вещество даже с помощью каких-либо физических или химических средств.

      Что из следующего приведет к образованию смеси?

      Для образования смеси должно присутствовать не менее двух веществ.Опять же, это не образует смеси, потому что здесь также присутствует только одно вещество. Здесь присутствуют два вещества. Но когда мы добавляем натрий в воду , они химически реагируют, образуя новое вещество.

      Какой тип смеси можно разделить фильтрованием?

      Смеси, которые обычно можно разделить с помощью фильтров, представляют собой смесь твердого вещества с жидкостью, твердого вещества с газом и твердого вещества с твердым телом . Фильтрация – это процесс, при котором нежелательные частицы отделяются от полезных.

      Какие два вещества должен смешать учащийся, чтобы получилась однородная смесь?

      Ответ: Однородная смесь образуется при смешивании воды и соли . Объяснение: Однородная смесь: Смесь, имеющая одинаковый состав по всему объему, называется гомогенной смесью.

      Какие различные состояния материи объясняют и различают каждое состояние?

      Твердое тело — это состояние , в котором материя сохраняет фиксированный объем и форму; жидкость — это состояние, в котором материя приспосабливается к форме своего сосуда, но лишь незначительно изменяется в объеме; а газ — это состояние, в котором материя расширяется, чтобы занять объем и форму своего сосуда.

      Какой образец вещества классифицируется как вещество?

      Элементы и соединения

      Любой образец вещества, имеющий одинаковые физические и химические свойства во всем образце , называется веществом. Существует два типа веществ. Вещество, которое нельзя разложить на химически более простые компоненты, называется элементом. Алюминий, который используется в банках с газировкой, является элементом.

      Какова классификация твердых тел?

      Твердые тела можно классифицировать на основе связей, удерживающих атомы или молекулы вместе.Этот подход классифицирует твердые тела как молекулярные, ковалентные, ионные или металлические . Йод (I 2 ), сахар (C 12 H 22 O 11 ) и полиэтилен являются примерами соединений, которые представляют собой молекулярные твердые вещества при комнатной температуре.

      Почему необходимо классифицировать вещество на твердое, жидкое и газообразное?

      Целью классификации является выявление объектов с общими или сходными свойствами . Твердые вещества, жидкости и газы обеспечивают простые средства классификации состояния материи, но это не единственные группы, используемые учеными.… Изменение температуры может привести к изменению состояния вещества.

      Что такое классификация газа?

      Класс опасности

      Сжатые газы классифицируются как класса I, II, III или IV в порядке убывания опасности . * Классы основаны на летальной концентрации для 50% подопытных животных (крыс) каждого газа (LC50).

      Что из перечисленного является общим для твердых и жидких тел?

      У твердых тел и жидкостей есть нечто общее.Они оба состояния материи . Материя есть везде. Это все, что занимает пространство и имеет массу.

      Примеры гомогенных и гетерогенных смесей, классификация веществ, химия

      Чистые вещества и смеси! (Классификация вещества)

      Смесь: классификация и характеристики

      Чистые вещества и смеси, элементы и соединения, классификация веществ, химические примеры,

      Похожие запросы

      химическая реакция — единственный способ отделить a(n) .
      туман состоит из капель воды в воздухе
      что является свойством каждой однородной смеси
      что является свойством каждой смеси?
      , который осядет, если его посадить на стол? суспензия коллоид раствор соединение
      какое вещество распадается в однородную смесь?
      , который описывает однородную смесь?
      какое вещество расщепляется в однородной смеси? коллоидный раствор растворенный растворитель

      Смотрите больше статей в категории: Часто задаваемые вопросы Кнопка «Вернуться к началу»

      Классификация на основе расстояния с использованием распределения смеси по данным микробиома

      Abstract

      Текущие достижения в области методов секвенирования нового поколения позволили исследователям провести всесторонние исследования микробиома и заболеваний человека, а недавние исследования выявили связь между микробиомом человека и последствиями для здоровья при ряде хронических заболеваний.Однако структура данных микробиома, характеризующаяся разреженностью и асимметрией, создает проблемы для создания эффективных классификаторов. Чтобы решить эту проблему, мы представляем инновационный подход к классификации на основе расстояний с использованием смешанных распределений (DCMD). Метод направлен на повышение производительности классификации с использованием данных сообщества микробиомов, где предикторы состоят из разреженных и разнородных данных подсчета. Этот подход моделирует неопределенность, присущую разреженным подсчетам, путем оценки распределения смеси для выборочных данных и представления каждого наблюдения в виде распределения, зависящего от наблюдаемых подсчетов и расчетной смеси, которые затем используются в качестве входных данных для классификации на основе расстояния.Метод реализован в рамках классификации k средних и k ближайших соседей. Мы разрабатываем две метрики расстояния, которые дают оптимальные результаты. Производительность модели оценивается с использованием смоделированных данных и данных исследования микробиома человека, а результаты сравниваются с рядом существующих подходов машинного обучения и классификации на основе расстояния. Предлагаемый метод конкурентоспособен по сравнению с другими подходами к машинному обучению и демонстрирует явное улучшение по сравнению с широко используемыми классификаторами на основе расстояния, подчеркивая важность моделирования разреженности для достижения оптимальных результатов.Диапазон применимости и надежности делают предлагаемый метод жизнеспособной альтернативой для классификации с использованием разреженных данных о подсчете микробиома. Исходный код доступен по адресу https ://github . com/kshestop/DCMD для академического использования.

      Резюме автора

      Неравномерная производительность традиционных дистанционных классификаторов при использовании профилей микробиома для прогнозирования статуса заболевания побудила нас разработать новый метод, основанный на расстоянии, который учитывает неопределенность при моделировании разреженных подсчетов.Мы предлагаем алгоритм классификации, который использует смешанные распределения для измерения нормированных расстояний между распределениями микробиома, который лучше моделирует основную структуру, обрабатывая лишние нули и разреженность, присущие подсчетам численности микробов. Применение DCMD показало улучшенную производительность и надежность классификации, что делает предлагаемый метод улучшенной альтернативой классификации с использованием данных микробиома.

      Образец цитирования: Шестопалофф К., Донг М., Гао Ф., Сюй В. (2021) DCMD: классификация на основе расстояния с использованием распределения смесей по данным микробиома.PLoS Comput Biol 17(3): е1008799. https://doi.org/10.1371/journal.pcbi.1008799

      Редактор: Элханан Боренштейн, Вашингтонский университет, США

      Получено: 10 декабря 2020 г.; Принято: 15 февраля 2021 г .; Опубликовано: 12 марта 2021 г.

      Copyright: © 2021 Shestopaloff et al. Это статья с открытым доступом, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.

      Доступность данных: Набор данных, проанализированный в этом исследовании, общедоступен в репозитории MLRepo. Колоректальный рак: https://knights-lab.github.io/MLRepo/docs/kostic_healthy_tumor.html; и болезнь Крона: https://knights-lab.github.io/MLRepo/docs/gevers_control_cd_ileum.html.

      Финансирование: W.X. финансировался Советом по естественным наукам и инженерным исследованиям Канады (грант NSERC RGPIN-2017-06672), Crohn’s and Colitis Canada (грант CCC CCC-GEMIII) и благотворительным фондом Хелмсли.К.С. был поддержан CCC Grant CCC-GEMIII. MD был поддержан грантом NSERC RGPIN-2017-06672 и грантом CCC CCC-GEMIII. Спонсоры не участвовали в разработке исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи.

      Конкурирующие интересы: Авторы заявили об отсутствии конкурирующих интересов.

      Это документ PLOS Computational Biology Methods.

      Введение

      Растущая доступность высокопроизводительных технологий привела к созданию большого количества типов данных для анализа.Одним из типов данных, которые недавно приобрели популярность, являются данные сообщества микробиома, которые состоят из подсчетов идентифицированных бактерий в конкретных местах. Неуклонно растет число исследований, демонстрирующих связь между микробиомом человека и последствиями для здоровья, такими как воспалительные заболевания кишечника [1], диабет 2 типа [2] и сердечно-сосудистые заболевания [3], что делает его важной темой исследований. . Однако наличие разреженности и асимметрии, которые характеризуют этот тип данных, создает ряд проблем для статистического моделирования.Эти проблемы побудили к методологическим разработкам, которые расширяют существующие алгоритмы, особенно для задач классификации, связанных с рисками заболеваний.

      Одним из популярных классов подходов, часто используемых с данными о микробиоме, являются методы, основанные на расстоянии, которые дифференцируют и классифицируют образцы с использованием расстояний, полученных из многомерных измерений. Повсеместные методы включают k -средних [4] и k -ближайших соседей ( k -NN) [5], которые были адаптированы к таким данным с переменными преобразованиями с использованием евклидовых расстояний, манхэттенского расстояния и ряда других мер. [6–8].Другие адаптации, такие как классификатор ближайших усохших центроидов (NSC) на основе расстояния, который был разработан для использования данных микрочипов [9]. NSC берет среднее значение относительной численности для каждого класса в качестве центроидов класса [10,11], а затем рассчитывает стандартизированные квадраты расстояний между новыми образцами и центроидами класса.

      Ряд линейных и аддитивных классификаторов машинного обучения; такие как LASSO, гребенчатая регрессия (RR), случайный лес (RF), повышение градиента (GB) и машины опорных векторов (SVM) также широко используются для данных с высокой пропускной способностью [7,11–13].Некоторые методы основаны на пенализации (LASSO и RR) в логистических моделях [14,15], как правило, с логарифмически преобразованными скорректированными подсчетами или относительной численностью операционных таксономических единиц (OTU) для устранения асимметрии [16]. Алгоритмы RF и GB основаны на последовательно построенных классификаторах и автоматически включают выбор признаков [17,18]. Другие недавние методологические разработки для данных о микробиоме включают регрессионные модели с филогенетическим древовидным штрафным термином [19] и обратную регрессию для борьбы с чрезмерной дисперсией нулей в данных подсчета [20].Однако на метод, ориентированный на дерево, может чрезмерно влиять информация о дереве [19], а филогенетическое дерево не всегда доступно. Существующие методы включают данные наблюдаемого подсчета или относительную численность непосредственно при вычислении расстояний или определении ковариат с некоторыми видами преобразования OTU для учета асимметрии. Ни один из методов явно не учитывает и не моделирует основную неопределенность, присущую разреженным данным подсчета.

      Эта статья направлена ​​на решение этих проблем в структуре классификации, где предикторы представляют собой разреженные и разнородные данные подсчета.Шестопалофф и др. [21] предложили представлять данные подсчета с использованием распределения смеси для анализа различий между сообществами микробиомов. Мы распространяем этот метод на классификацию на основе расстояния с использованием смешанного распределения (DCMD), что специально устраняет неопределенность в разреженных и малочисленных данных. DCMD измеряет расстояние между специфическими для образца распределениями OTU, а не между подсчетами или относительной численностью, что лучше моделирует структуру данных микробиома для измерения расстояния.DCMD также может обрабатывать избыточное количество нулей, что потенциально может повысить точность прогнозирования при использовании разреженных OTU. В этой статье мы используем два исследования моделирования, чтобы показать преимущество DCMD для классификации по сравнению с существующими метриками расстояния и сравнить его с обычными методами машинного обучения. Мы обеспечиваем всестороннее сравнение методов классификации на основе расстояния ( k -средних, k -NN и NSC) и методов машинного обучения (RF, GB, LASSO, RR и SVM) в различных настройках моделирования. наши знания ранее не изучались.Мы также иллюстрируем эффективность DCMD в двух исследованиях микробиома человека [22,23]. Статья завершается обсуждением достоинств, недостатков и сферы применимости предложенной методологии.

      Метод

      В этом разделе мы описываем структуру DCMD. Основные этапы модели включают спецификацию распределения смеси и оценку параметров для моделирования наблюдаемых данных, расчет условных распределений для каждой выборки и расчет расстояний между выборками и центрами кластеров для использования в методах классификации на основе расстояний.Модель смеси и оценка условного распределения описаны в Shestopaloff et al. [21]. Предлагается смоделировать базовую структуру уровня популяции наблюдаемых данных подсчета, используя смешанное распределение с компонентами Пуассона-Гамма, а затем обусловливая наблюдаемые подсчеты выборки и разрешение для получения распределений, специфичных для выборки. На следующем этапе мы используем характерные для выборки распределения для классификации, вычисляя расстояния между распределениями.

      Спецификация модели и оценка

      Данные микробиома

      обычно состоят из количества OTU, как показано в таблице 1.Обозначения, используемые в нашей формулировке метода, следующие:

      N N IJ

    2. 6, I 6, I = 1, …, I для J = 1, …, J , количество J Th OTU I -й выборки .

      N N 3 I 6, Общее количество выровненных читателей образца I , N I 6 = Σ J N IJ

      Без ограничения общности мы сосредоточимся на конкретной OTU и опустим нижний индекс j th для последующих обозначений.Предположим, что наблюдаемые значения, N 3 I I

      6, являются Poisson распределены со скоростью R 3 I = Q I N I , I = 1,…, I для пробы i , где q i — относительная численность, характерная для отдельных особей, и выбирается из некоторого общего распределения относительной численности OTU G q .Тогда у нас есть, где , и , с выборкой из , которая представляет собой скорость, нормализованную к среднему выборочному чтению, чтобы убедиться, что подсчеты обрабатываются по одной и той же шкале. Таким образом, наблюдаемое количество для конкретного участка OTU составляет

      Поскольку распределение OTU имеет нулевое раздувание, асимметрию и тяжелые хвосты, мы предлагаем смешанное распределение для аппроксимации G . Для положительных скоростей на заданном интервале мы указываем набор гамма-компонентов, Γ( α , β ), с формой α и скоростью β , чтобы охватить диапазон данных.Чтобы отделить структурные нули от низкочастотных и необнаруженных выборок, мы включаем массу нулевой точки, где многоточечная масса, , где P ( n i > C ) = 1, C – точка усечения, 1 (∙) – индикаторная функция. Полный набор компонентов смеси ω = ( G Z

      6, G 3 1 , G 2 , …, G M 6, G C + C + 6) Где G 3 Z Z 6 – это ноль-точечная масса, г 3 м 6, м = 1,2, …, м , это набор гаммас компоненты Γ( α m , β m ) и G C + масса точек a high-cost.Процесс определения компонентов смешанной модели подробно описан в разделе «Моделирование».

      Определите вес каждого компонента как где w z – вес нулевой массы, соответствующая Гамма-компонента, а w C + — вес многоточечной массы. Определять количество видов, наблюдаемых x раз во всех выборках для x = z , 0,1,2,…, C , C +.Тогда наша цель состоит в минимизации , где ожидаемое совокупное количество y x . Примечание. м , β м /( t i + β 9003 ) 6 [ 9003 ] .Определять как вероятность наблюдения отсчета x из m-го компонента смеси при условии разрешения t i . Тогда, где p xm = ∑ i p xmi / I . Таким образом, мы имеем целевую функцию: (1)

      Оценка получена путем оптимизации целевой функции метода наименьших квадратов (1) с использованием алгоритма Бройдена-Флетчера-Гольдфарба-Шанно (BFGS) [24] с расширенным методом Лагранжа [25] для ограничений.

      Из-за редкости данных мы оптимизируем только веса и фиксируем параметры гаммы. Попытка смоделировать низкочастотную структуру путем оптимизации как весов, так и параметров гаммы ( α m , β m ) с помощью максимизации ожидания (EM) приводит к смещенным структурным нулевым оценкам и плохой общее соответствие низких показателей [26]. В этом контексте EM также подвержена проблемам с числами, сходимостью к локальным минимумам и часто может быть слишком медленной в вычислительном отношении для этого типа приложений [26].С другой стороны, BFGS предоставляет гораздо более быструю и надежную альтернативу.

      Взвешенное распределение смеси

      Чтобы устранить неопределенность, связанную с определением компонентов для смешанной модели, особенно для низких скоростей, где разреженность часто является проблемой, мы определяем набор вложенных моделей Φ l , l = 1,…, L , с различными компонентами для моделирования структуры ставки около нуля. Мы оцениваем совместную смешанную модель, используя непараметрический алгоритм начальной загрузки.Как указано в Шестопалофф и соавт. [21], мы можем получить вес v ( l ) каждой модели-кандидата, который представляет собой долю раз, когда каждая модель выбирается как оптимальная относительно наблюдаемых данных, и вычислить веса для совместного распределения смеси. Пусть w l будут оценочными весами для каждой модели-кандидата, Φ l , с нулями, присвоенными весам компонентов, не включенных в конкретную модель, тогда веса совместной модели равны w = ∑ l v ( l ) w 6.

      Распределение для конкретного образца

      После того, как у нас есть распределение для OTU, мы можем оценить характерные для выборки распределения, обуславливая наблюдаемое количество n i , оценочные веса смеси w и разрешение t

      3 90 . Мы можем получить вероятность того, что образец i был отобран из определенного компонента, как: (2)

      Вероятность быть отнесенным к нулевой массе равна P ( i G 0 ) = 1 ( n i i масса точки равна P ( i G C + ) = 1 ( n i > >

      6 ).Определить вес смеси для конкретного образца как куда

      С тех пор, как специфичные для образцов веса были скорректированы для индивидуальных разрешений T 3 I 6 через P IM Вероятность, вероятностяки Poasson-Gamma NB ( α , β /(1+ β )). Также обратите внимание, что мы дифференцировали нули в нашем смешанном распределении, которые определены как структурные нули, x = z , и наблюдаемые нули, x = 0.Учитывая базовое распределение скоростей из совместной модели смеси, мы можем затем рассчитать вероятность наблюдения количества x = z , 0,1,…, C , C + от каждого компонента смеси G м ас

      за точечные массы у нас P ( x = x = G Z 6) = 1 ( N I = 0) и P ( X = x | G C + ) = 1 ( n i > C ), соответственноЧтобы упростить представление распределения, задайте вектор вероятностей для х = z , 0,1,…, С , С +. Тогда мы можем определить дискретную плотность вероятности для выборки i как куда

      Векторы P ( x ) в матрице P являются векторами, дающими вероятность наблюдения x от каждого компонента смеси, которые могут быть предварительно рассчитаны для расчета расстояния.Обзор того, как получить распределения смеси для конкретного образца с учетом набора компонентов распределения смеси, показан на рис. 1.

      Рис. 1.

      Рабочий процесс для получения специфичного для образца распределения смеси для каждого образца i в OTU j: 1) Задайте набор вложенных распределений смесей-кандидатов, используя определенный набор компонентов; 2) применить бутстреп к набору вложенных моделей и вычислить веса каждой модели смеси-кандидата, а затем вычислить веса совместного распределения смеси; 3) Оцените характерные для выборки распределения, зависящие от n i , t i и совместного распределения смеси.

      https://doi.org/10.1371/journal.pcbi.1008799.g001

      Классификация

      После вычисления распределения для каждой выборки мы используем алгоритмы k- средних и k- ближайших соседей (k-NN) для классификации. В этом разделе мы расскажем, как применять эти алгоритмы с использованием двух мер расстояния: дискретной L 2 (D- L 2 ) нормы и непрерывной кумулятивной L 2 (CC- L 5). 2 ) норм.

      Меры расстояния

      данной задней вероятности F 3 I , совокупная задняя вероятность F I 6, а также предполагаемый набор весов W I для образца I , метрики расстояния:

      D- L 2 Стандарт : (3) где х = z , 0,1,…, С , С +. Обратите внимание, что мы включаем структурный нулевой компонент z отдельно и что расстояния зависят только от весов.Для нескольких предикторов, j = 1, …, J, общее расстояние между выборками i 1 и i 2 представляет собой сумму по всем предикторам, .

      CC- L 2 Стандарт : (4) где – матрица с записью ( м 1 , м 2 ) для каждого непрерывного компонента смеси. Подробности вывода можно найти у Шестопалова [26].

      Классификация на основе расстояния.

      Мы используем расстояния, рассчитанные в уравнениях (3) и (4) в рамках k -средних и k -NN. В k -means среднее значение каждого класса вычисляется на основе обучающих данных, и баллы классифицируются до ближайшего класса. В k -NN выборки классифицируются как режим меток из k ближайших соседей обучающей выборки. Шаги алгоритмов k -means и k -NN следующие:

      K -means : Чтобы адаптировать алгоритм k -means, мы оцениваем среднее распределение для каждого класса путем минимизации расстояний распределения между ним и образцами класса, обусловленными заданным расстоянием.Поскольку расстояния равны L 2 норм и зависят только от весов, как показано в уравнениях (3) и (4), среднее значение весов для каждого класса дает оптимум. Алгоритм реализован следующим образом:

      1. Шаг 1: Определите среднее значение весов для j th предиктора в классе k ,

      , где | N k , j | – количество отсчетов в классе k предиктора j, k = 1,…, K и j = 1,…, J ;

      1. Шаг 2: вычислить расстояние до среднего значения для выборки i по всем предикторам,
      1. Шаг 3: Прогнозирование метки образца i как ближайшего среднего,

      K -NN: После вычисления попарных расстояний между выборками и суммирования по предикторам их можно использовать непосредственно для определения ближайших соседей для классификации.Алгоритм для k -NN следующий:

      1. Шаг 1: вычислить парное расстояние образец I
      2. 3 1 и I 3 2 , I 3 1 , I 3 2 = 1, …, I , I 1 i 2 ,
      1. Шаг 2: Для выборки i выберите k выборок с наименьшим расстоянием до выборки i , оптимальные k можно определить с помощью перекрестной проверки (CV) в обучающем наборе или существующей эвристики.
      2. Шаг 3: Подсчитайте метки k ближайших соседей, затем выборка i прогнозируется как мода k меток.

      Общий рабочий процесс DCMD в рамках k -means и k -NN представлен на рис. 2.

      Рис. 2. Иллюстрация k-средних и структуры k-NN с использованием распределений по конкретным образцам.

      Для k-средних (верхняя панель) расстояние между новой выборкой и средним значением класса A меньше, чем до среднего значения класса B, поэтому новая выборка прогнозируется как класс A.Для k-NN (нижняя панель) с использованием 3 ближайших соседей новая выборка прогнозируется как класс A.

      https://doi.org/10.1371/journal.pcbi.1008799.g002

      Моделирование

      Генерация данных

      Чтобы оценить эффективность метода DCMD, мы разрабатываем моделирующие исследования, которые имитируют данные подсчета сообщества микробиомов и оценивают эффективность классификации. Мы моделируем отдельное распределение смеси для каждого класса, отдельные частоты дискретизации и разрешения для получения наблюдаемых подсчетов.Для распределения смеси количество компонентов M отбирается из Unif (5, 15). А количество проб, отбираемых от каждого компонента смеси, устанавливается путем группирования проб из Beta ( α b , β b ) через равномерные интервалы, с b менялись, чтобы получить разные средние классы и уровни разреженности, а с β b ~ Unif (2, 6.5) контролировать рассеивание. Наблюдаемые подсчеты для каждой выборки затем генерируются как , где частота дискретизации и разрешение t i ~ Unif (2/3, 5/4).

      Мы рассматриваем двух- и трехклассовые исходы с несколькими сценариями моделирования для каждого случая. Для результата с двумя классами настройки параметров и сводная статистика для каждого сценария показаны в таблице 2. Сценарии 1 и 2 имеют низкую разреженность данных, а сценарии 3 и 4 очень разрежены. Сценарии 1 и 3 имеют слабо дифференцированные классы (небольшая разница в α b ), а сценарии 2 и 4 имеют сильно дифференцированные классы (большая разница в α b ).Размер выборки: I = 800, по 400 выборок на класс и J = 25 OTU. Для результата с тремя классами настройки параметров и сводная статистика показаны в таблице S1. Сценарии 1–3 имеют сильно дифференцированные классы с разной степенью разреженности. Размер выборки I = 1200, по 400 выборок в каждом классе и J = 25 OTU. Сценарий нулевого случая также генерируется путем перестановки меток классов, а показатели производительности для каждого результата и сценария вычисляются по 100 повторениям моделирования.

      Спецификация модели смеси

      Спецификация компонентов модели смеси должна быть основана на данных, и основное требование состоит в том, чтобы гамма-распределения позволяли надлежащим образом охватить наблюдаемые данные. Мы разделяем данные подсчета на пять интервалов и применяем разные стратегии для указания компонентов на каждом интервале. Моделирование нулей и низкоскоростных структур основано на [28], а моделирование более высоких отсчетов основано на [21].

      1. Структурные нули: для данных с наблюдаемыми нулями нулевая масса P( X = 0) = 1 включается для моделирования нулевой инфляции.
      2. Низкие подсчеты ( x ∈ [0,1,2,3]): мы указываем компоненты как апостериорные коэффициенты Пуассона с равномерными априорными значениями для каждого из подсчетов, что составляет Γ ( x +1, 1). Следовательно, мы включаем Г (1,1), Г (2,1), Г (3,1) и Г (4,1). Пороговое значение установлено равным x = 3, потому что апостериорные ставки для более высоких значений имеют низкую вероятность наблюдения нуля, и мы хотим дифференцировать распределения, относящиеся к моделированию нулевой инфляции.Мы также хотим проверить, улучшает ли более близкое к нулю значение массы при низких скоростях. Поэтому мы добавляем экспоненты с более высокой скоростью, β , чтобы иметь больше массы около нуля. В этом случае мы включаем Γ (1,2) в модели-кандидаты. Потенциально мы можем включить в модель Γ (1,3) или другие члены, а затем применить процедуру, описанную выше, для выбора оптимального сочетания. Более полное обсуждение, основанное на моделировании разреженных подсчетов для оценки общего количества видов, можно найти в [28].
      3. Целочисленные подсчеты ( x ∈ [4,5,6,7]): Компоненты в этом диапазоне также указываются как скорость после Γ ( x +1, 1) через целые интервалы. Этот блок существует в качестве буфера, гарантирующего отсутствие пробелов в охвате после распределений с малым числом участников, поскольку это потенциально может привести к смещению структурных нулевых и низкочастотных оценок. Это указывается до тех пор, пока последний целочисленный компонент не будет мало перекрываться с предыдущим низкочастотным компонентом. В нашей формулировке мы используем верхний предел x = 7, поскольку моделирование показало незначительные различия между x = 7 и x = 8.Целочисленные компоненты включают Γ (4,1),…, Γ (7,1).
      4. Высокие значения ( x ∈[8,…, C ]): Высокие значения, как правило, имеют большой диапазон, и указывать их на целых интервалах нецелесообразно. В этом случае задаем количество компонент исходя из диапазона данных и задаем α m через равномерные интервалы по линейно-логарифмической шкале от 8 до C = q p , набор квантилей данных.Использование от 10 до 15 компонентов хорошо работало в прошлых приложениях [21]. Для нашего моделирования p = 0,85 является эффективным порогом, что означает, что C является 85%-ным квантилем выборки.
      5. Чрезвычайно высокие подсчеты ( x > C ): Эти подсчеты усечены до точечной массы P ( X > C ) = 1, отчасти из-за низкой плотности в этом диапазоне и неопределенности в их моделировании и отчасти для уменьшения времени вычислений. Описанная выше эвристика спецификации смешанной модели предназначена в первую очередь для моделирования малочисленных OTU, которые охватывают большую часть информации о данных микробиома.OTU с более высоким содержанием можно смоделировать, ограничив спецификацию компонентов более высокими значениями и увеличив p.

      Полная модель, которую мы используем для наших данных, включает [ Γ (1,2), Γ (1,1),…, Γ (7,1), Γ (8,1)] , наряду с различными компонентами с большим количеством элементов. Вложенные модели генерируются путем постепенного исключения Γ (1,2), [ Γ (1,2), Γ (1,1)],… всего пять моделей. Пример спецификации модели для одного из OTU представлен в таблице S2.

      Методы подбора и сравнения моделей

      Предложенный метод сравнивается с k -means и k -NN с использованием евклидовых и манхэттенских расстояний относительной численности, NSC на основе расстояний, а также классификаторов LASSO, RF, GB, RF и SVM [29]. Модели обучаются с использованием разделения обучающего и тестового наборов 60/40 [30], при этом обучающий набор остается одинаковым для всех классификаторов в каждой реплике. Для методов машинного обучения мы используем существующие пакеты и настраиваем гиперпараметры с помощью перекрестной проверки, когда это необходимо, см. подробности в тексте S1.

      Результаты моделирования

      Для результата с двумя классами точность классификации для каждой модели и сценария представлена ​​на рис. 3. Оранжевые диаграммы представляют собой результаты для предложенного метода DCMD в рамках k -mean и k -NN. Синие диаграммы представляют собой другие методы, основанные на расстоянии, включая k -среднее значение и k -NN с евклидовым и манхэттенским расстоянием и NSC. Зеленые диаграммы показывают результаты для методов машинного обучения, включая RF, GB, LASSO, RR и SVM.Пунктирная красная линия показывает среднюю точность лучшего метода в каждом сценарии. Результаты показывают, что в сценариях 1 и 2, когда разреженность низкая, k – означает с CC-L 2 norm, за которым следует k – означает с D- L 2 норма, в то время как в сценариях 3 и 4, когда разреженность высока, k – означает с D- L 2 норма дает наилучшую производительность, затем k – означает с CC-L 2 норм.В целом, DCMD в структуре k средних с нормами L 2 превосходит другие методы классификации для всех типов сигналов и структур данных для двухклассового результата. Различия в точности в методах, основанных на расстоянии, также становятся более выраженными в пользу DCMD, среди которых k – означает превосходство k -NN. Специализированный подход NSC работал аналогично DCMD в рамках k -NN.Однако NSC обычно не достигает k — означает DCMD и другие методы машинного обучения.

      Рис. 3. Результат двух классов: диаграмма точности более 100 повторений для каждого метода и сценария.

      Предлагаемый метод DCMD показан оранжевым цветом для k -средних и k -NN с расстояниями D- L 2 и CC- L 2 . Другие методы, основанные на расстоянии, показаны синим цветом, включая k -средних и k -NN с евклидовыми и манхэттенскими расстояниями и NSC.Методы машинного обучения показаны зеленым цветом, включая случайный лес (RF), повышение градиента (GB), LASSO, гребневую регрессию (RR), метод опорных векторов (SVM). Пунктирная красная линия показывает среднюю точность лучшего метода в каждом сценарии.

      https://doi.org/10.1371/journal.pcbi.1008799.g003

      В таблице 3 показана сводная статистика оценки F1 в более чем 100 повторах для результатов двух классов. Лучшие результаты в каждом сценарии выделены. Подобно точности, DCMD с нормами L 2 дает самые высокие оценки F1 (оценка F1 (SD) = 0.68 (0,034), 0,92 (0,017), 0,77 (0,028), 0,95 (0,014) в сценариях 1–4 соответственно), что лучше, чем лучший метод машинного обучения (GB: 0,64 (0,033), RF и RR: 0,89). (0,019), ЛАССО: 0,75 (0,030), ГБ: 0,94 (0,016) в сценариях 1–4 соответственно). DCMD показывает стабильную хорошую производительность в каждом сценарии по сравнению с другими методами.

      Точность классификации каждой модели и сценария для результата с тремя классами представлена ​​на рис. 4. Для сценариев 1–3 классы различаются по разным уровням разреженности, и мы наблюдаем, что DCMD конкурирует с оптимальными методами машинного обучения. .Хотя RR имеет аналогичную прогностическую точность DCMD в сценариях 1 и 3, а GB имеет аналогичную прогностическую точность в сценарии 2, DCMD постоянно улучшается по сравнению с оптимальным методом сравнения. Ни одна из моделей не является систематически избыточной, поскольку точность прогнозирования в нулевом случае (сценарий 4) близка к базовой точности 0,33.

      Рис. 4. Результат для трех классов: диаграмма точности более 100 повторов для каждого метода и сценария.

      Предлагаемый метод DCMD показан оранжевым цветом для k-средних и k-NN с расстояниями D-L 2 и CC-L 2 .Другие методы, основанные на расстоянии, показаны синим цветом, включая k-means и k-NN с евклидовыми и манхэттенскими расстояниями и NSC. Методы машинного обучения показаны зеленым цветом, включая случайный лес (RF), повышение градиента (GB), LASSO, гребневую регрессию (RR), метод опорных векторов (SVM). Пунктирная красная линия показывает среднюю точность лучшего метода в каждом сценарии.

      https://doi.org/10.1371/journal.pcbi.1008799.g004

      Заявка

      Описание данных

      Мы тестируем наш метод на данных двух исследований микробиома.Во-первых, это исследование колоректального рака, о котором сообщает [22]. Всего было собрано 190 образцов (95 пар) у 95 пациентов в Университетской больнице Валь д’Эброн в Барселоне и в сотрудничестве с Genomics Collaborative. Исследование было направлено на выявление ассоциаций между микробиомом опухоли и колоректальной карциномой. Собирали как ткань колоректальной аденокарциномы, так и соседние непораженные ткани. Таблица подсчета OTU, созданная с помощью амплификации 16S, была получена из Microbiome Learning Repo [12]. Перед обучением модели восемнадцать образцов с общим числом прочтений менее 100 были исключены из набора данных, и мы также исключили OTU со средней относительной численностью менее 0.001, в результате чего было получено 149 OTU и 172 образца (86 пар), использованных для дифференциации опухолевых и нормальных тканей. Второе исследование представляет собой исследование болезни Крона (БК) методом случай-контроль в многоцентровой когорте, которое было разработано для изучения того, как микробиота способствует патогенезу БК [23]. Профили были получены с помощью секвенирования Illumina 16S рРНК. Набор данных был загружен из Microbiome Learning Repo [12] и состоял из 140 образцов биопсии ткани подвздошной кишки. Минимальная глубина выборки установлена ​​на уровне 100, а OTU ограничены нулевой пропорцией менее 90%, оставляя для анализа 140 проб (78 случаев и 62 контроля) и 31 OTU.

      Примерка модели и оценка

      Для обоих наборов данных мы сравниваем наш предложенный L 2 – основанный на норме k – средний классификатор и k – NN классификатор с пятью другими классификаторами на основе расстояния ( k – средний-евклидов, k – означает-Манхэттен, к -NN-Евклидов, к -NN-Манхэттен, NSC) и шесть методов машинного обучения (RF, GB, LASSO, RR, SVM). Мы оцениваем производительность модели с помощью 10-кратного CV. На каждой итерации одна часть данных обрабатывается как тестовый набор, а остальные девять используются для обучения.Спецификация DCMD и других классификаторов такая же, как и в симуляциях (см. текст S1). Мы рассчитываем точность, точность, полноту и оценку F1 в качестве показателей для сравнения.

      Для данных о колоректальном раке мы уменьшаем пространство предикторов для классификаторов на основе расстояния путем одномерного скрининга OTU с помощью непараметрического U-критерия Манна-Уитни на обучающей выборке. Чтобы скорректировать множественные сравнения, мы используем значения q, полученные методом Бенджамини-Хохберга (BH) [31], и сохраняем OTU со значениями q меньше 0.05 в каждом тренировочном наборе. Среднее количество OTU, выбранных из каждого обучающего набора, равно 42 (диапазон: 13–57). Для подходов машинного обучения мы включаем все 149 OTU. В набор данных CD включена 31 OTU для всех методов.

      Прикладные результаты

      Прогностическая эффективность каждого классификатора для исследований колоректального рака и целиакии представлена ​​в таблицах 4 и 5 соответственно. Точность k -средняя с нормой D-L 2 равна 0.67 для колоректального рака и 0,73 для БК, что является лучшим методом для колоректального рака и вторым лучшим методом для БК. Показатели F1 также являются одними из самых высоких для обоих наборов данных, что указывает на то, что DCMD имеет неизменно оптимальную производительность и улучшение по сравнению с другими классификаторами. Точность прогнозирования k -средних с нормой CC-L 2 немного хуже, вероятно, из-за высоких долей нулей в предикторах, что согласуется с результатами моделирования.Точно так же DCMD превосходит евклидовы и манхэттенские расстояния в пределах k -средних, а k -средних превосходит k -NN в целом. В пределах k -NN точность и оценка F1 указывают на то, что DCMD имеет прогностическую эффективность, сравнимую с евклидовыми или манхэттенскими расстояниями. Подход NSC имеет точность 0,67 и точность 0,72 для колоректального рака с отзывом 0,56 и оценкой F1 0,63, что заметно ниже, чем у классификаторов k -средних.Работа с данными компакт-диска нестабильна.

      По сравнению с методами машинного обучения DCMD с k -means превосходит RF, GB, LASSO, RR и SVM в первом наборе данных. Когда результаты воспроизводятся с контролем выбора переменной классификатора на основе расстояния (таблица S3), методы машинного обучения повышают производительность, за исключением ГБ. Во втором наборе данных LASSO и SVM являются лучшими методами с точностью 0,74, немного превосходя точность 0,73 для k -средних с нормой D-L 2 .В противном случае DCMD k – означает, что нормы DL 2 и CC-L 2 либо эквивалентны, либо превосходят подходы машинного обучения.

      Обсуждение

      Результаты наших исследований моделирования и приложений микробиома показывают, что предлагаемый метод DCMD хорошо работает в ряде сценариев, достигая хороших результатов классификации при использовании разреженных данных в качестве предикторов. Точность прогнозирования постоянно улучшается по сравнению с другими расстояниями в классификаторах на основе расстояния.Это либо выгодно, либо конкурентоспособно по сравнению с рядом методов машинного обучения в широком диапазоне сценариев. Улучшенная производительность DCMD на разреженных данных является результатом использования смешанного распределения для представления наблюдаемых данных подсчета, потому что смешанное распределение может не только моделировать основную неопределенность в наблюдаемом подсчете выборки, но также учитывать нулевую инфляцию. Улучшение особенно значительно по сравнению с другими расстояниями в обычных классификаторах k -means и k -NN.

      Различия в производительности между нормами D-L 2 и CC-L 2 можно объяснить структурой данных. В менее разреженных сценариях структура данных лучше моделируется непрерывной структурой скорости, что дает небольшое преимущество для метрики CC-L 2 . В то время как в сценариях с более высоким ZP и малым количеством, норма DL 2 позволяет нам использовать конкретное разграничение нулей на структурные и неструктурные и напрямую моделировать ожидаемые количества, что может дополнительно фиксировать общую структуру предикторов. лучше использовать для дифференциации.

      Поскольку основное усовершенствование метода DCMD связано с акцентом на моделировании данных более низкого уровня и связанной с этим неопределенности, необходимо точно определить базовый набор компонентов смеси для низких дебитов. Смесь также должна моделировать данные с низким и высоким числом в одном и том же масштабе, где плотность последних часто невелика из-за редких интервалов наблюдения. Кроме того, невозможно применить преобразование, чтобы сделать данные более плотными из-за обилия нулей и дискретного характера малых значений.Тем не менее, взвешивание вложенных моделей-кандидатов и предложенная эвристика для определения распределений с более высоким числом в логарифмически-линейной шкале хорошо сработали в наших симуляциях, поскольку они частично имитируют логарифмическое преобразование, обычно применяемое к таким данным.

      Предлагаемый метод DCMD сформулирован на основе расстояния, поэтому он не включает конкретных механизмов для выбора переменных. В то время как различные предикторы могут быть включены в сумму расстояний, этот процесс не автоматизирован.В нашем случае мы использовали простой непараметрический U-критерий Манна-Уитни для выбора признаков, который хорошо работал на данных исследования. Однако более продвинутые и специализированные методы выбора признаков могут применяться отдельно для других приложений. Кроме того, мы отмечаем, что модель предназначена для использования количества сайтов микробиома, а непрерывные ковариаты необходимо моделировать отдельно с использованием непрерывных распределений, в то время как категориальные ковариаты могут быть включены только как фиктивные переменные. Эти переменные также будут обрабатываться в той же шкале в метрике расстояния, если не указано иное.

      Несмотря на эти недостатки, мы считаем, что наш основной вклад — представление наблюдений в виде распределений для отражения неопределенности и использование показателей расстояния распределения — будет ценным для всех, кто анализирует разреженные данные. Эта формулировка может компенсировать некоторые недостатки, присущие методам на основе расстояния, до такой степени, что она обеспечивает конкурентоспособность с более сложными классификаторами, а также со специально разработанными подходами, такими как NSC. Методы, которые сделали DCMD выгодным для классификации, когда ожидается, что данные будут разреженными, особенно в рамках структуры, основанной на расстоянии, следует рассмотреть для повышения производительности модели.

      Заключение

      В этой статье мы представляем основанный на расстоянии метод классификации данных подсчета микробиома. Подход DCMD моделирует наблюдаемые данные, используя смешанные распределения, и вычисляет L 2 -нормы для алгоритмов классификации на основе расстояния. Этот метод специально разработан для точного моделирования структур с малым числом элементов, устраняя присущую им разреженность путем представления каждого наблюдаемого числа в виде распределения, и продемонстрировано, что его производительность улучшилась благодаря исследованиям моделирования и двум приложениям микробиома.Подчеркивается важность учета неопределенности в разреженных данных и демонстрируются связанные с этим улучшения точности классификации при использовании распределений. Производительность предложенного DCMD конкурентоспособна по сравнению с рядом методов машинного обучения и значительно превосходит другие распространенные показатели в моделях классификации на основе расстояния. Согласованная и улучшенная производительность для различных структур данных делает этот подход жизнеспособной альтернативой для моделирования и классификации данных о количестве микробиомов, особенно в рамках системы, основанной на расстоянии.

      Благодарности

      Авторы признательны и благодарны за поддержку Tomcyzk AI and Microbiome Working Group.

      Каталожные номера

      1. 1. Morgan XC, Tickle TL, Sokol H, Gevers D, Devaney KL, Ward DV, et al. Дисфункция кишечного микробиома при воспалительных заболеваниях кишечника и лечении. Геном биол. 2012;13:R79. пмид:23013615
      2. 2. Карлссон Ф.Х., Тремароли В., Ноокаев И., Бергстрем Г., Бере С.Дж., Фагерберг Б. и др.Метагеном кишечника у европейских женщин с нормальным, нарушенным и диабетическим контролем глюкозы. Природа. 2013; 498:99–103. пмид:23719380
      3. 3. Шрайнер А.Б., Као Ю.Ю., Янг В.Б. Микробиом кишечника в норме и при болезни. Курр Опин Гастроэнтерол. 2015;31:69–75. пмид:25394236
      4. 4. Кэм ЛМЛ, Нейман Дж. Материалы Пятого симпозиума Беркли по математической статистике и вероятности: биология и проблемы здоровья. Калифорнийский университет Press; 1967; 281–297.
      5. 5.Чжан З. Введение в машинное обучение: k ближайших соседей. Энн Трансл Мед. 2016;4. пмид:27386492
      6. 6. Liu Z, Hsiao W, Cantarel BL, Drábek EF, Fraser-Liggett C. Разреженное дистанционное обучение для одновременной мультиклассовой классификации и выбора признаков метагеномных данных. Биоинформатика. 2011;27:3242–9. пмид:21984758
      7. 7. Статников А., Хенафф М., Нарендра В., Конганти К., Ли З., Ян Л. и др. Всесторонняя оценка методов многокатегориальной классификации микробиомных данных.Микробиом. 2013;1:11. пмид:24456583
      8. 8. Розенталь М., Айелло А.Е., Ченовет С., Голдберг Д., Ларсон Э., Глор Г. и др. Влияние технических источников изменчивости на динамику микробиома рук медицинских работников. ПЛОС Один. 2014;9. пмид:24551205
      9. 9. Тибширани Р., Хасти Т., Нарасимхан Б., Чу Г. Диагностика множественных типов рака с помощью уменьшенных центроидов экспрессии генов. Труды Национальной академии наук. 2002; 99: 6567–72. пмид:12011421
      10. 10.Zhang X, Zhao Y, Xu J, Xue Z, Zhang M, Pang X и др. Модуляция кишечной микробиоты берберином и метформином во время лечения ожирения у крыс, вызванного диетой с высоким содержанием жиров. Научные отчеты. 2015;5:14405. пмид:26396057
      11. 11. Найтс Д., Костелло Э.К., Найт Р. Контролируемая классификация микробиоты человека. Обзоры микробиологии FEMS. 2011;35:343–59. пмид:21039646
      12. 12. Вангай П., Хиллманн Б. М., Найтс Д. Репозиторий изучения микробиома (ML Repo): общедоступный репозиторий задач регрессии и классификации микробиома.Гигасайнс. 2019;8. пмид:31042284
      13. 13. Галкин Ф., Алипер А., Путин Е., Кузнецов И., Гладышев В. Н., Жаворонков А. Часы старения микробиома человека, основанные на глубоком обучении и тандеме перестановок, имеют важность и накопленные локальные эффекты. препринт. биоинформатика; 2018. https://doi.org/10.1101/507780 .
      14. 14. Тибширани Р. Регрессионное сокращение и отбор с помощью лассо. Журнал Королевского статистического общества: серия B (методологическая).1996; 58: 267–88.
      15. 15. Хорл А.Е., Кеннард Р.В. Ридж-регрессия: смещенная оценка неортогональных задач. Технометрия. 1970; 12: 55–67.
      16. 16. Вайс С., Сюй З. З., Педдада С., Амир А., Биттингер К., Гонсалес А. и др. Стратегии нормализации и дифференциальной численности микробов зависят от характеристик данных. Микробиом. 2017;5:27. пмид:28253908
      17. 17. Брейман Л. Случайные леса. Машинное обучение. 2001;45:5–32.
      18. 18. Фридман Дж. Х.Приближение жадных функций: машина повышения градиента. Анналы статистики. 2001; 29:1189–232.
      19. 19. Ван Т., Чжао Х. Построение прогностических микробных сигнатур на нескольких таксономических уровнях. Журнал Американской статистической ассоциации. 2017; 112:1022–31.
      20. 20. Ван Т., Ян С., Чжао Х. Прогнозный анализ данных секвенирования микробиома. Биометрия. 2019;75:875–84. пмид:30994187
      21. 21. Шестопалофф К., Эскобар М.Д., Сюй В.Анализ различий между сообществами микробиомов с использованием распределения смесей: анализ различий между сообществами микробиомов. Статистика в медицине. 2018; 37: 4036–53. пмид:30039541
      22. 22. Костич А.Д., Геверс Д., Педамаллу С.С., Мишо М., Дюк Ф., Эрл А.М. и др. Геномный анализ выявляет ассоциацию Fusobacterium с колоректальной карциномой. Исследование генома. 2012; 22: 292–98. пмид:22009990
      23. 23. Геверс Д., Кугатасан С., Денсон Л. А. и соавт. Нелеченный микробиом при впервые возникшей болезни Крона.Клетка-хозяин и микроб. 2014;15:382–92. пмид:24629344
      24. 24. Nocedal J. Обновление квазиньютоновских матриц с ограниченным объемом памяти. Математика вычислений. 1980; 35: 773–82.
      25. 25. Конн А.Р., Гулд Н.И.М., Тойн Филипп. Глобально сходящийся расширенный лагранжев алгоритм оптимизации с общими ограничениями и простыми границами. Журнал SIAM по численному анализу. 1991; 28: 545–72.
      26. 26. Шестопалов К. Анализ экологических сообществ с использованием смешанных моделей [кандидатская диссертация].Торонто, Канада: Университет Торонто. 2017.
      27. 27. Goutte C, Gaussier E. Вероятностная интерпретация точности, отзыва и F-оценки с последствиями для оценки. В: Losada DE, Fernández-Luna JM, редакторы. Достижения в области информационного поиска. Берлин, Гейдельберг: Springer. 2005; 345–59. https://doi.org/10.1016/j.ijmedinf.2004.04.017 pmid:15694638
      28. 28. Шестопалов К., Сюй В., Эскобар М.Д. Оценка общего количества видов с использованием взвешенной комбинации ожидаемого количества компонентов распределения смеси.Экологическая и экологическая статистика. 2020; 27: 447–65.
      29. 29. Сайкенс Дж. А., Вандевалле Дж. Метод наименьших квадратов поддерживает классификаторы векторных машин. Нейронная обработка писем. 1999; 9: 293–300.
      30. 30. Педриц В., Сковрон А., Крейнович В. Справочник по гранулярным вычислениям. Джон Уайли и сыновья. 2008; 133–36.
      31. 31. Бенджамини Ю., Хохберг Ю. Контроль уровня ложных открытий: практичный и мощный подход к множественному тестированию. Журнал Королевского статистического общества, серия B (методологический).1995; 57: 289–300.
      .

    Добавить комментарий

    Ваш адрес email не будет опубликован.