divergence debugger for on-device inference

Отладчик расхождений: где и насколько разъехались fp32 и int8, CPU и NPU — по каждой ноде ONNX-графа.