Интерферометрични модели на крилата (WIPs) и машинно обучение, стъпка към автоматизирана идентификация на мухата цеце (Glossina spp.)

Модел на припокриване на крила според родове, видове крила, род и екземпляри

За да настроим протокол, чрез който WIP могат да бъдат получени и използвани за идентифициране на видове Glossina, ние проведохме експерименти, които позволиха визуализация на WIP при различни условия. Първо, беше разкрито запазването на модела на смущения върху крилото Нашето заседание Той беше анализиран според позицията на радиална симетрия (intrado/extrado) и аксиална симетрия (лява и дясна). След процеса, показан на Фигура 1, снимки Нашето заседание Взети са проби. Както е показано на Фигура 5а, показваща текущата работа на ж. фоскепиИ на jm. Двете котви И на ж. gambiensis, не са наблюдавани забележителни разлики в припокриващия се цветен модел според позицията на крилото по време на получаване на изображение (интрадо/екстрадо или дясно/ляво). Следователно позицията на крилото върху плъзгача не е повлияла на действието на създадения Webb. За да определим възпроизводимостта на WIP, ние анализирахме устойчивостта на този фенотип върху голяма серия от мъжки и женски проби от различни видове (фиг. 5b). Забелязахме контраст в модела на припокриващи се цветове, записани върху крилата. Този модел беше специфичен за вида и представляваше чест слаб полов диморфизъм, който трябва да бъде допълнително изследван. И накрая, ние изследвахме стабилността на текущата работа според датата на вземане на проби и статуса на консервант. Дискретни разлики се записват в припокриващия се светлинен модел. Въпреки това, цялостната организация на модела и цветният състав остават сходни, демонстрирайки възможността за генериране на последователни интерферентни модели от проби, запазени в етанол или изсушени на въздух за дълго време (фиг. 5в).

Фигура 5

Разнообразието от попълнени полета, създадени върху Glossina spp. на мен (а) ориентация на крилото в горната част ж. фоскепиЦентър jm. Двете котви най-нисък ж. gambiensis(б) проби и (° С) дата за запазване. I, входът и E, изходът.

Цветните шарки на крилата са начертани на ръка от заснетите изображения (фиг. 6). Тази първа фотограма е начертана с помощта на прясно уловени екземпляри от Камерун (P.28, а за повечето проби, принадлежащи към групата IRD, вижте Таблица 1 за характеристиките на пробите. За групови проби селекцията беше извършена от експерт ентомолог по време на улавянето на мухите (Таблица 1). Беше извършена идентификация на проби от полеви капани, както беше съобщено по-рано7.

Фигура 6
Фигура 6Фигура 6

посочени Нашето заседание spp илюстриран ключ, извлечен от вътреочния модел на крилото.

Поразително е, че 4 изпъкнали припокриващи се цвята се разкриват върху лъскавите зелени, жълти, сини и червени крила. Графичният ключ показва разпределението на червени, сини и жълти цветови модели според видовете и подвидовете, които събрахме по време на изследването (фиг. 6). Зеленото не се отчита в графичния ключ, тъй като представлява цвета на фона на интерференцията и по този начин изглежда бяло в графичния ключ. Цветовата вариация изглежда е по-малка за крилата Нашето заседание вид, към който принадлежи Устиня подрод, в сравнение с принадлежащите към два тигъра или Нашето заседание подгени. Разликите между видовете се появиха, свързани с формата на червения модел. Нашето заседание вид, към който принадлежи два тигъра И на Нашето заседание Изглежда, че подвидовете носят многоцветни мрежи. Полов диморфизъм с този характер е налице при всички екземпляри, представители на изследвания вид, мъжки и женски.

Припокриващият се модел, който се вижда на крилото на мухата цеце, може да помогне за създаването на автоматична система за идентификация. серия снимки Нашето заседание Видовете и подвидовете са описани в момента и са взети най-важните HAT и AAT вектори. Да се ​​тества дали такъв анализ може да се счита за подход за пръстови отпечатъци Нашето заседание Идентификация на видовете, необходимо е да се прави разлика между повечето, ако не всички, Нашето заседание Понастоящем известни видове или подвидове. Както е показано в таблица 1, 23 от 31 посочени в момента Нашето заседание Събрани са видове и подвидове. Произхождат от полето, ARIM колекция или лабораторно отгледани Нашето заседание Той лети.

Обучение и класификация

Проучихме класификаторите за обучение само върху набора от данни и върху набор от данни, където отрицателни проби, съдържащи много не-Нашето заседание Насекоми като отрицателни проби. Обучение на CNN (конволюционна невронна мрежа) на комбинация от Нашето заседание И промянаНашето заседание Изображенията могат да подобрят модела, за да направят правилни прогнози. Базата данни е генерирана от общо 5516 изображения на WIP от двукрили, към които принадлежат 1766 изображения. Нашето заседание Океан. Ние умишлено изрязваме и коригираме всички изображения към едно и също измерение, което означава, че (1) размерът на крилата не може да се използва като дискриминационен критерий за процеса на класификация; (2) Не можем да използваме параметрите, за да класифицираме процеса на крилата. Фокусирахме нашия анализ основно върху Нашето заседание видове и подвидове, документирани като доказани вектори за HAT и AAT, Например Gp palpalis, G. p. ГамбияИ на ж. фоскепиИ на ж. quazensisИ на ж. МартиниИ на jm. Двете котвиИ на jm. състезателиИ на jm. ЦентърИ на G. tachninoidesИ на Г. Хейза, СвинъртонИ на G. pallidipidesИ Г. Лонгибалбис. Нашата база данни съдържа повече от 80% от Нашето заседание Видове с медицинско или ветеринарно значение. Просто ж. Мартини отсъстваха в нашата база данни сред видовете Glossina, участващи в предаването на трипанозома. Наборът от данни, който формирахме, представлява около 70% от видовото разнообразие, тъй като съдържа 23 изображения на WIPs Нашето заседание Описани видове и подвидове.

За съжаление, някои бяха представени само с няколко изображения, а за 9 бяха използвани не повече от 15 проби (Таблица 1). След това осигурихме точността на процеса на класификация на различни таксономични нива за род, вид и подвид. Класификаторът показа високо ниво на точност близо до 100% на ниво род, което показва неговата ефективност при класифициране/разпознаване Нашето заседание пол (виж таблица 3а). В следващата стъпка го изпълнете правилно в обозначението Нашето заседание Картините на видово ниво са допълнително предизвикани от видовите комплекси, Който. , G. fuscipesИ на Г. Палпалис, И на Двете котви G.. Точността на класификатора показа невероятна точност, като точността варира от 90% до G. fuscipes И на Двете котви G. комплекси, до 100% Г. Палпалис от тях (виж таблица 3b). След това оценихме процеса на класификация на ниво вид и подвид. По време на експеримента само 45% от Нашето заседание Видът има записи с повече от 8 снимки. Въпреки това, за почти всички тествани проби, точността на класификация също показа точност от 33 до 100%. Нашият седящ ум, ум, ум, ум И на ж. gambiensis са основни доставчици на шапки в Западна Африка. Те могат да се кръстосват в лабораторията, но мъжките потомци са стерилни23. Тези два подвида са трудни за идентифициране, дори ако мъжките показват някои морфологични разлики в крайното уголемяване на долния сегмент на техните гениталии.24. Донякъде задълбочената методология на обучение беше много точна, с точност до 97% (вижте Таблица 3c). Въпреки че алгоритъмът не успява да избере 2 Нашето заседание категории по време на тестване, това може да се обясни отчасти с много малкия брой WIP изображения, представящи видовете в тестовия набор от данни (само две изображения на категория). Въз основа на нашия подход за сегментиране на набор от данни открихме, че тези класове представляват 8 изображения за обучение. Това е случай на прекомерно оборудване поради недостатъчни данни за обучение, въпреки самоналоженото ограничение от общо 10 изображения на клас. Резултатите за точността на класификацията на Glossina са обобщени в таблица 3C.

Таблица 3. Резултати и матрица на объркване за Нашето заседание В сравнение с други родове (a) за класифициране на екземпляри, принадлежащи към комплексите Balbalal, Murcitan и Phoscapis (b) и на ниво вид и подвид (c).

Неправилно класифицирани снимки

Изследването на модела на машинно обучение за уязвимости може да помогне за идентифицирането на основните проблеми. Това може да стане чрез преглед на изображенията, които не са били погрешно предвидени. Това ще идентифицира причините, поради които е трудно да се класифицира изображението за модела. На фигура 7 са показани избрани примери. Моделите за дълбоко обучение се основават предимно на текстури, а не на форми. Следователно, по-изчерпателен комплект за обучение може да избегне дефекти в качеството на изображения или проби. За да избегнете объркване на настройките при правене на снимки; Това може да подобри точността на автоматизираната класификация. Към приложението може да се добави ръководство с инструкции, което да съветва участниците да правят висококачествени изображения Нашето заседание проби.

Фигура 7
Фигура 7

Грешно изображение Някои примери за изображения, които са прогнозирани неправилно от модела на CNN.

Разгледайте процеса на идентификация след преобразуване на изображението и изрязване

Като цяло, ръчното компютърно подпомагано преобразуване на изображения е инструмент за тестване на силата на процеса на идентификация, който имитира размазването по време на получаване на изображение, влошаване на качеството на изображението и целостта на страните на образеца. В допълнение, необработените изображения на придобиването бяха тествани за идентификация (Таблица 4). Корекцията беше извършена върху изображения, избрани от набора от данни за обучение (Таблица 4а) и набора от тестови данни (Таблица 4b). И в двата случая модификациите на изображението влияят върху точността на дефиницията. Първо, неуспехът да се идентифицират проби от муха цеце, недостатъчно представени в набора от данни (Glocina fusca fusca Уокър, 1849). За повечето проби затъмняването (гаус или леща) не промени драстично способността на обучения модел да идентифицира точно проби на ниво вид. Ефектът от влошаването на видеото върху Нашето заседание Изберете няколко мостри. за ж. фоскепиИ на ж. quazensis, И на G. tachinoides, промяната не е повлияла на идентифицирането на вида, освен в случай на хвърляне и флоп на снимка (RVB). В заключение, с нашия обучен модел промяната на изображението възпрепятства способността за разпознаване на модела.

Таблица 4 Точност на определяне на ръчно трансформирани и изчислени WIP изображения и коригирани изображения, заснети в набора от данни за обучение (а) и набор от тестови данни (б)