Microsoft lanceert Phi-4: een superinferentieel AI-model om te concurreren met DeepSeek R1

Samenvatting:

Microsoft heeft Phi-4 inferentiële AI-modellen gelanceerd, die zijn getraind met 14 miljard en 3.8 miljard parameters.
Ondanks hun kleine formaat concurreren de Phi-4-inferentiemodellen met veel grotere modellen, zoals de DeepSeek R1 en o3-mini.
Volgens Microsoft kunnen de Phi-4-inferentiemodellen worden uitgevoerd op pc's met Windows Copilot+, dankzij hun kleine formaat.

Microsoft heeft drie nieuwe deductieve AI-modellen gelanceerd, waaronder Phi-4-reasoning, Phi-4-reasoning-plus en Phi-4-mini-reasoning. Dit zijn kleine taalmodellen, ontworpen voor eindapparaten zoals Windows-computers en mobiele apparaten. Het AI-model met Phi-4-redenering is getraind met 14 miljard parameters en kan complexe gevolgtrekkingen uitvoeren.

Het Phi-4-redenerings-plus model gebruikt hetzelfde basismodel, maar gebruikt een extra berekening van de inferentietijd, ongeveer 1.5 keer het aantal tokens vergeleken met Phi-4-redenering, voor een hogere nauwkeurigheid. Ondanks de kleine omvang van de Phi-4-redeneringsmodellen kunnen ze concurreren met grotere modellen zoals Diep zoeken R1 671B en o3-mini.

In de GPQA-standaard behaalt het Phi-4-redenering-plus-14B-model een score van 69.3%, terwijl het o3-mini 77.7%. In de AIME 2025-test scoort de Phi-4-reasoning-plus-14B vervolgens 78% en de o3-mini 82.5%. Het laat zien dat het kleine model van Microsoft erg dicht bij de belangrijkste inferentiemodellen ligt, die veel groter zijn.

Volgens Microsoft zijn de Phi-4-inferentiemodellen getraind via gecontroleerde fijnafstemming.Over zorgvuldig samengestelde inferentiedemonstraties van OpenAI o3-mini. Verder schrijft Microsoft: “Het model laat zien dat nauwkeurige gegevensopmaak en synthetische datasets van hoge kwaliteit ervoor zorgen dat kleinere modellen kunnen concurreren met grotere modellen.. '

Daarnaast presteert het kleinere Phi-4-mini-redeneringsmodel, getraind met slechts 3.8 miljard parameters, beter dan veel 7B- en 8B-modellen. In benchmarks zoals AIME 24, MATH 500 en GPQA Diamond levert het Phi-4-mini-reasoning-3.8B-model concurrerende resultaten, die dicht in de buurt komen van de o1-mini. Het werd voltooidAanpassenPhi-4-mini-modelNauwkeurig gebruik van synthetische gegevens gegenereerd door het Deepseek-R1-model. '

De Phi-modellen van Microsoft worden al standaard gebruikt op Windows-computers. Copilot+ pc'sHet profiteert van de ingebouwde neurale verwerkingseenheid. Het zal interessant zijn om te zien hoe Phi-4-inferentiemodellen de AI-prestaties op het apparaat verbeteren.

Diepzoeken