DeepSeek-R1 Комбинирајќи вештачка интелигенција и рабно пресметување за индустриски IoT

Вовед

Малите дестилирани модели на DeepSeek-R1 се фино подесени со користење на податоци од синџир на размислување генерирани од DeepSeek-R1, означени со...ознаки, наследувајќи ги можностите за расудување на R1. Овие фино подесени бази на податоци експлицитно вклучуваат процеси на расудување како што се распаѓање на проблеми и средни дедукции. Засилувачкото учење ги усогласи моделите на однесување на дестилираниот модел со чекорите на расудување генерирани од R1. Овој механизам на дестилација им овозможува на малите модели да ја одржат пресметковната ефикасност, додека добиваат способности за комплексно расудување блиски до оние на поголемите модели, што е од значајна применлива вредност во сценарија со ограничени ресурси. На пример, верзијата 14B постигнува 92% од комплетирањето на кодот од оригиналниот модел DeepSeek-R1. Оваа статија го претставува дестилираниот модел DeepSeek-R1 и неговите основни апликации во индустриското edge computing, сумирани во следните четири насоки, заедно со специфични случаи на имплементација:

dc3c637c5bead8b62ed51b6d83ac0b4

Предвидувачко одржување на опрема

Техничка имплементација

Сензорска фузија:

Интегрирајте податоци за вибрации, температура и струја од PLC-ата преку протоколот Modbus (стапка на семплирање 1 kHz).

Екстракција на карактеристики:

Стартувајте го Edge Impulse на Jetson Orin NX за да извлечете карактеристики на временски серии од 128-димензионални вредности.

Моделска инференција:

Распоредете го моделот DeepSeek-R1-Distill-14B, внесувајќи вектори на карактеристики за да генерирате вредности на веројатност за грешка.

Динамичко прилагодување:

Активирајте налози за работа за одржување кога довербата е > 85% и иницирајте секундарен процес на верификација кога е < 60%.

Релевантен случај

„Шнајдер Електрик“ го имплементираше ова решение на рударски машини, намалувајќи ги стапките на лажно позитивни резултати за 63% и трошоците за одржување за 41%.

1

Извршување на дестилираниот модел DeepSeek R1 на компјутери со вештачка интелигенција InHand Edge

Подобрена визуелна инспекција

Излезна архитектура

Типичен цевковод за распоредување:

камера = GigE_Vision_Camera(500fps) # Гигабитна индустриска камера
frame = camera.capture() # Сними слика
претходно обработено = OpenCV.denoise(frame) # Отстранување на шум претходна обработка
defect_type = DeepSeek_R1_7B.infer(претходно обработено) # Класификација на дефекти
ако defekt_type != 'нормално':
PLC.trigger_reject() # Механизам за сортирање на активирање

Метрики за перформанси

Доцнење во обработката:

82 ms (Jetson AGX Orin)

Точност:

Детекцијата на дефекти со инјектирање достигнува 98,7%.

2

Импликации на DeepSeek R1: Победници и губитници во генеративниот синџир на вредности на вештачката интелигенција

Оптимизација на процесот на проток

Клучни технологии

Интеракција со природен јазик:

Операторите ги опишуваат аномалиите на опремата преку глас (на пр., „Флуктуација на притисокот на екструдерот ±0,3 MPa“).

Мултимодално расудување:

Моделот генерира предлози за оптимизација врз основа на историските податоци за опремата (на пр., прилагодување на брзината на завртката за 2,5%).

Верификација на дигитални близнаци:

Валидација на симулација на параметри на платформата EdgeX Foundry.

Ефект на имплементација

Хемиската фабрика на БАСФ ја усвои оваа шема, постигнувајќи намалување од 17% на потрошувачката на енергија и зголемување од 9% на квалитетот на производот.

3

Edge AI и иднината на бизнисот: OpenAI o1 наспроти DeepSeek R1 за здравствена заштита, автомобилска индустрија и IIoT

Моментално пребарување на базата на знаење

Архитектонски дизајн

Локална векторска база на податоци:

Користете го ChromaDB за складирање на прирачници за опрема и спецификации за процеси (димензија за вградување 768).

Хибридно пребарување:

Комбинирајте го алгоритмот BM25 + косинусна сличност за барањето.

Генерирање на резултати:

Моделот R1-7B ги сумира и рафинира резултатите од пребарувањето.

Типичен случај

Инженерите на „Сименс“ ги решаваа дефектите на инверторот преку барања на природен јазик, намалувајќи го просечното време на обработка за 58%.

Предизвици и решенија за распоредување

Ограничувања на меморијата:

Користена е технологија за квантизација на KV Cache, со што се намалува употребата на меморија кај моделот 14B од 32GB на 9GB.

Обезбедување перформанси во реално време:

Стабилизирана латенција на единечна инференција на ±15 ms преку оптимизација на CUDA графиконот.

Моделско поместување:

Неделни инкрементални ажурирања (пренесување само 2% од параметрите).

Екстремни средини:

Дизајниран за широк температурен опсег од -40°C до 85°C со ниво на заштита IP67.

5
微信图片_20240614024031.jpg1

Заклучок

Тековните трошоци за распоредување сега се намалени на 599 долари/јазол (Jetson Orin NX), со скалабилни апликации кои се формираат во сектори како што се производството на 3C, автомобилското склопување и енергетската хемија. Се очекува континуираната оптимизација на архитектурата на MoE и технологијата за квантизација да му овозможат на моделот 70B да работи на рабните уреди до крајот на 2025 година.

Пронајдете решение за ELV кабел

Контролни кабли

За BMS, BUS, индустриски, инструментален кабел.

Структуриран кабелски систем

Мрежа и податоци, оптички кабел, спојувачки кабел, модули, предна плоча

Преглед на изложби и настани за 2024 година

16-18 април 2024 година, Блискоисточна енергија во Дубаи

16-18 април 2024 година, Securika во Москва

9 мај 2024 година, настан за лансирање на нови производи и технологии во Шангај

22-25 октомври 2024 година, SECURITY CHINA во Пекинг

19-20 ноември 2024 година, ПОВРЗАНИОТ СВЕТ, Јужна Африка


Време на објавување: 07.02.2025