We hebben het aantal decimalen voor log(2) in slechts 3 uur verdubbeld tot 42.7 biljoen cijfers, een efficiëntieverbetering van ongeveer 50x in 3 jaar.
Het volgende is van Jorge Zuniga, een onafhankelijke burgerlijk ingenieur die zich richt op het vinden van wiskundige recepten. Jorge heeft met Jordan samengewerkt aan het benutten van servers en opslag in ons laboratorium om fundamentele vooruitgang te boeken in de wiskunde. We vonden het geweldig om samen met Jorge aan dit onderzoek deel te nemen en onze kleine teaservideo op sociale media van een paar weken geleden oogstte enorme steun.
Bekijk dit bericht op Instagram
Sinds die video zijn we met Jorge blijven samenwerken om modellen op werkstations uit te proberen en ze vervolgens volledig op de computer uit te voeren Supermicro E1.S-server, gevuld met KIOXIA XD7P E1.S SSD's. De dichtheid van het platform en de mogelijkheid om zoveel schijven dicht bij de CPU te houden, maken dit een geweldig platform voor dit soort wiskundig onderzoek.
Met trots presenteren wij de bevindingen van Jorge hier. – Brian Beeler
Kwaliteitscontrole door middel van stresstests vertegenwoordigt een gezond beleid om de werkelijke capaciteit van een bepaalde hardwarefaciliteit te bepalen. Number crunching is een wijdverbreide praktijk voor de uitvoering van dit beleid. Met name bij het evalueren van de werkelijke prestaties van uw systeem met professionele kwaliteit zijn er meerdere tools beschikbaar om nauwkeurige resultaten te leveren.
Eén ervan, ontwikkeld in Oostenrijk en een favoriet van mij, is dat wel Matthias Zronek BenchMate, die verschillende veeleisende stresstests bevat voor SSD's, geheugen, GPU's en CPU's. Andere krachtige computerpakketten, zoals Zronek's GPUPI, berekenen de constante π met behulp van de GPU. De berekening van decimalen van π is een standaard en veel voorkomende test die vaak is verschenen in de gespecialiseerde wetenschappelijke pers en sommige in wiskunde gespecialiseerde sociale netwerken wanneer het record van bekende decimalen is verbroken. Vandaag, Er zijn 100 biljoen decimalen (10^14) van π bekend.
In BenchMate is er ook De y-cruncher van Alex Yee, een platform dat CPU-Multicore-berekening van vele wiskundige constanten, waaronder π, met extreem hoge precisie mogelijk maakt, en een enorm aantal decimalen levert dat alleen wordt beperkt door de capaciteit van het systeem. In dit geval kunnen verschillende strategieën worden gevolgd, zoals het kiezen van een constante en het benadrukken van het systeem om een voldoende groot aantal decimalen te berekenen door de verstreken tijd vast te leggen. Dit biedt een uitstekende maatstaf om de prestaties van verschillende geïsoleerde opstellingen te rangschikken en te vergelijken.
Als er voldoende geïnstalleerde capaciteit is, kan er bovendien een systeemconfiguratie worden uitgevoerd om het bekende aantal decimalen van een bepaalde constante te doorbreken, een uitdaging die StorageReview met groot succes is aangegaan. Zoals gerapporteerd in de decembermaand Opmerking voor 2023: ik heb met het StorageReview-team samengewerkt om het bekende aantal decimalen voor verschillende wiskundige constanten te verbeteren. We zijn er niet alleen in geslaagd deze records te verbeteren, maar we hebben het ook in de kortst mogelijke tijd gedaan. Het is historisch gezien normaal dat het weken of maanden duurt om dit te doen. Door te werken met StorageReview hebben we dit voor alle constanten in slechts enkele uren bereikt en, in sommige gevallen, door het aantal bekende decimalen te verdubbelen. De technologie die beschikbaar is bij StorageReview heeft tijdsbesparingen met ordes van grootte mogelijk gemaakt. Een samenvatting van deze resultaten en hun details kunt u vinden hier.
Registreer resultaten ingesteld door y-cruncher. Voor een volledige lijst met records ingesteld door y-cruncher, ga naar nummerwereld.
Deze notitie heeft precies betrekking op deze resultaten. Om een record met decimalen te realiseren, moet je in drie lagen handelen.
Vanaf de onderkant, de derde of laatste laag, is de hardware-installatie; dit betekent een robuuste SSD-installatie, krachtige RAM-capaciteit en ultramoderne multicore CPU. Veel van deze details en de toegepaste opstelling zijn online te zien hier.
De tweede of tussenlaag omvat de software, dat wil zeggen de y-cruncher, die de link vormt tussen de initiële en de laatste laag. Om de prestaties te verbeteren, onderhoudt y-cruncher verschillende atom-uitvoerbare bestanden, afhankelijk van het type multicore CPU in het systeem. Het juiste uitvoerende atoom wordt tijdens het uitvoeren automatisch gekozen. Met de benchtester kan de gebruiker een constante selecteren en het bijbehorende algoritme toepassen. Dit algoritme kan rechtstreeks in het systeem worden geïntegreerd of, als dat niet het geval is, voor de implementatie gebruik maken van aangepaste configuratiebestanden. Details over de implementatie en het gebruik van de y-cruncher kunnen worden bekeken op nummerwereld. y-cruncher-software is voortdurend in ontwikkeling en surft op de golf van nieuwe hardwaretechnologieën.
De eerste of initiële laag is het algoritme, of beter gezegd de wiskundige formule die is geïmplementeerd om de constante te berekenen die als invoer dient voor de y-cruncher. Elke constante kan worden weergegeven door een oneindig aantal formules, die bijna allemaal slechte prestaties leveren, in de zin dat veel wiskundige bewerkingen slechts enkele correcte cijfers kunnen opleveren.
Aan de andere kant staat de categorie efficiënte formules. Daarvan valt de hypergeometrische reeks op. Binnen die reeks bevinden zich een handvol die geschikt zijn om records te breken, omdat ze in relatief korte tijd veel decimalen kunnen leveren. In feite is de primaire formule voor het berekenen van π, bekend als het Chudnovsky-algoritme, een van de hypergeometrische formules.
In nauwe samenwerking met het StorageReview-team zijn we ook de uitdaging aangegaan om naar deze formules te zoeken, dat wil zeggen door op de eerste laag te handelen om een zeer efficiënte hypergeometrische reeks te bereiken die het mogelijk maakt om de snelste bekende formule te vinden. Hoe wordt dit gerealiseerd? Er is een multicore-opstelling nodig, hopelijk met zoveel mogelijk fysieke kernen, om gedistribueerd computergebruik toe te passen, aangezien het proces zeer CPU-veeleisend is, maar gemakkelijk kan worden geparallelliseerd met een grote vermindering van de rekentijden. Als de nieuwe formule succesvol is, zal deze worden gebruikt om het record van bekende decimale cijfers voor die constante te verbreken.
We gebruikten een 64-core AMD Theadripper PRO 5995WX en bereidden codescripts voor op PARI-GP, een platform van de Universiteit van Bordeaux (Frankrijk) voor getaltheorie, en implementeerden een zoekalgoritme. Het doel is om een reeks 64-bit gehele getallen te identificeren die, wanneer ze worden ingevoegd in de parameters van een bepaalde hypergeometrische reeks met een bekende vaste structuur, de constante opleveren die we zoeken. Om dit te doen wordt het LLL-algoritme – een intern onderdeel van PARI GP – gebruikt, dat zoekt naar lineaire relaties tussen gehele getallen tussen meerdere nauwkeurige drijvende-kommawaarden. Meer wiskundige details zijn te vinden op mathoverflow.net.
We zijn eerst begonnen met de constante ζ(5) = 1.036927755143… omdat er geen erg efficiënte bekende formule voor bestaat, maar deze bleek erg ongrijpbaar. We konden geen bekende formule vinden buiten de unieke hypergeometrische reeks, die overigens niet snel genoeg is. Na een paar mislukte weken zijn we overgestapt op een hypergeometrische reeks voor logaritmen.
In dit geval hadden we succes, we konden de snelst bekende algoritmen vinden voor de fundamentele constanten log(2), log(3) en log(5), zoals beschreven in dit artikel. blog.
Nadat we de formules hadden blootgelegd, hebben we de scripts voor y-cruncher voorbereid. Jordan Ranous van Storagereview ontwierp de installatie om het aantal bekende decimalen te verslaan. In dit geval een opstelling op basis van 2x Intel Xeon Platinum 8460H en 512 GB SK Hynix RAM.
Deze opzet verdubbelde het aantal decimalen voor log(2) tot 3 biljoen cijfers in slechts 42.7 uur. Een tweede nieuw algoritme – de onderstaande G2-formule, ook gevonden in het StorageReview Lab – werd toegepast om de decimalen te verifiëren, wat 58.3 uur aan tijd kostte. Opgemerkt moet worden dat het vorige record van 2021 respectievelijk 98.9 en 61.7 dagen nodig had voor de berekening en verificatie van 1.5 biljoen decimalen. Dit betekent een efficiëntieverbetering van ongeveer 50x in 3 jaar.
We hebben alle vereiste stappen kunnen uitvoeren om tot bruikbare resultaten te komen. Een nieuwe formule voor een wiskundige constante, log(2), werd ontdekt met behulp van een speciaal op maat gemaakte installatie. Deze formule werd vervolgens toegepast op een op maat gemaakte opstelling om het record te verbreken voor het aantal decimalen dat bekend is voor deze specifieke constante.
StorageReview-faciliteiten hebben het mogelijk gemaakt om het volledige proces van het voorbereiden van benchtests te dekken op basis van numerieke berekeningen die een systeem onder grote druk zetten. Bij deze experimenten werden SSD, RAM en CPU met succes tot het uiterste getest.
– Jorge Zuniga
Neem contact op met StorageReview
Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed