Der Einfluss von SYPWAI auf das Tempo der KI im Jahr 2021

Artikel ansehen

Bevor die Meckerei losgeht: Das ist ein bezahlter Beitrag, deswegen steht da auch 2x Advertorial drin.

Das klingt so, als ob es von Manuel Rodriguez getextet wurde.

Das schwarz/weiße Motto „Solve your problem with AI“ soll also in das Haupt kopiert werden, da wo der klare Verstand drin ist. „Ich habe ein Problem, und das löse ich mit AI“ versus „ich habe ein Problem mit AI, und das löse ich, indem ich sämtliche AI vernichte.“

Und der klare Verstand erkennt so einen schwarz/weißen Werbemüll nicht, so dass der am Türsteher vorbei aufs Gelände kommt und dann seinen Schmutz überall im Haupt verteilt, so dass es vorbei ist mit dem sauberen klaren Verstand?

Mein KI-Fokus liegt zur Zeit auf multimodal transformers mit Video plus Audio Input, und wer dazu nichts bringt, der scheitert am Türsteher. Still images plus text können viele, ist mir persönlich aber nicht gut genug.

Edit: Das „Partnership on AI“ / „Partner, shit on AI“ aus den USA ist ähnlicher Müll.

Von deren Webseite:

Retrieving a dataset from the server … SYPWAI Soc produces neural network model training … Transferring the trained neural network model to the server

Und das SOC ist ein Raspberry Zero W. Das ist doch ein Witz! Nicht mal ein Jetson Nano. Völlig ungeeignet für jedwede Art von neuronalem Netzwerktraining. Sogar für Inferenz zu schwach.

Das ist also nur ein Vorwand für dasselbe wie vor 2 Tagen: Die wollen Proxies auf privaten Internetanschlüssen installieren, um damit nicht zurückverfolgt zu werden. Nimmt man für sowas nicht Tor her? Oder gleich ein Botnetz, wo die Benutzer gar nicht ahnen, dass da was fremdes über ihren Rechner läuft?

Die CPU, die dort druff ist, ist doch ein BCM2835 - dieser Chip ist doch fast 1:1 vergleichbar zu den Google TPUs, da die Hauptentwicklung bei Google auch von Broadcom gemacht wurde! Der BCM hat doch Tensor Cores inside, die speziell für Tensorflow-Frameworks und vergleichbare (neuronale) Netze
zum Einsatz kommen. So denn, wenn Sypwai nun als Beispiel 1 Mio. von den SOC-Units draussen hat und diese alle über deren Server-Knoten miteinander agieren, macht das doch wohl Sinn?!
Sypwai macht es halt anders! Nicht wie Google, die ganze RZs mit TPUs vollballern und zentralisiert rechnen lassen, sondern halt übers Netz. Ich denke, hier macht dann die schiere Menge das Ergebnis rund.
Einzeln ist die CPU natürlich nicht der Burner, aber in einem weltweiten Cluster schon - diese sollen ja auch die menschlichen Probanden unterstützen bzw. ergänzen!

Google / Broadcom TPU:

Das maschinelle Lernen (ML) hat in der Wirtschaft und Forschung Durchbrüche ermöglicht – von der Netzwerksicherheit bis hin zu medizinischen Diagnosen. Wir haben die Tensor Processing Unit (TPU) entwickelt, damit ähnlich weitreichende Fortschritte für jeden realisierbar sind. Die Cloud TPU ist eine speziell entwickelte anwendungsspezifische integrierte Schaltung (Application-Specific Integrated Circuit, ASIC) für ML-Arbeitslasten.

Interview mit Sypwai:

Was ist die Hauptidee des SYPWAI-Projekts?

Wir arbeiten im Bereich Data Mining, entwickeln und implementieren neue Lösungen, die von Menschen und Maschinen erstellt werden. Jeder kann sich am Training eines neuronalen Netzwerks beteiligen und damit Geld für sich selbst verdienen und der Gesellschaft nutzen. Der Prozess ist sehr einfach, ähnlich wie bei einem Lernspiel für Kinder. Schauen wir uns zum Beispiel ein Bild mit einer Katze an. Sie müssen die richtige Antwort unter den vorgeschlagenen Optionen auswählen: Vogel, Hund, Wolf, Fuchs, Katze und so weiter. Dieser Vorgang wird hundert, tausend, eine Million Mal wiederholt, bis das neuronale Netzwerk alle möglichen Optionen überprüft hat.

Wie sieht der Arbeitsprozess aus?

Zunächst muss man sich im System registrieren und eine einfache Testaufgabe absolvieren. Anschließend werden die Teilnehmer, die 99% der richtigen Antworten erreicht haben, zur Arbeit in der Neurosphere zugelassen. Für erledigte Aufgaben erhalten sie Token. Eine herkömmliche Münze entspricht einem Hundertstel eines Cents. Als nächstes planen wir ein solches Schema: Zuerst erledigen die Teilnehmer ihre Aufgaben, dann überprüfen andere sie. Wenn die meisten Antworten übereinstimmen, senden wir die erhaltenen Daten zur weiteren Bearbeitung. Wenn sieben von zehn Teilnehmern die gleiche Antwort gegeben haben, erhöht sich die Anzahl, und die Bewertung der Teilnehmer, die richtig geantwortet haben, steigt. Die Bewertung der Teilnehmer, die die falsche Option gewählt haben, wird herabgesetzt, sie erhalten weniger Geld.

Wie viel verdienen die Studenten?

Wir beschäftigen Menschen jeden Alters, auch Studenten. Das Markup für neuronale Netzwerke kann in Ihrer Freizeit durchgeführt werden. Sie können bis zu $ 400 pro Monat verdienen. Für eine Stunde etwa $ 5. Neurosphere berechnet den Verdienst in Kryptowährung. Das Geld kann sofort zu einem festen Satz an ein beliebiges Zahlungssystem ausgezahlt werden oder weiter investiert werden. Faszinierend, ist es nicht?

Welche Anfragen kommen von Firmenkunden?

Wir werden von Unternehmen angesprochen, die die Hilfe von künstlicher Intelligenz benötigen. Außerdem werden wir angefragt, wenn es darum geht, die globalen Probleme von Bewohnern verschiedener Länder zu lösen. Zum Beispiel bringen wir der künstlichen Intelligenz bei, wie sie das Problem der Reduzierung der Kriminalität in einer Stadt lösen kann. Wenn sich ein Unternehmen für die Entwicklung von Prothesen an uns wendet, beraten wir sie über den besten und billigsten Weg, diese herzustellen. Wir führen Umfragen durch, um auf der Grundlage der gewonnenen Daten Studien zu erstellen und die künstliche Intelligenz zu trainieren, um etwaige Probleme zu lösen. Umfragen helfen, die tatsächlichen Bedürfnisse der Nutzer zu erkennen und die Qualität von Produkten oder Dienstleistungen für ihre Bedürfnisse zu verbessern.

Je nach Kunde bereiten wir eine große Menge an Informationen über ihn vor: das verfolgte Ziel, Problemlösungsmethoden, wissenschaftliche Untersuchungen, Antworten der Menschen auf die Fragen, die ihnen helfen, eine Lösung zu finden, und so weiter.

Die Kundeninformationen werden mit einem XOR-Algorithmus verschlüsselt. Die direkte Übertragung wichtiger Daten zwischen Geräten und dem Server erfolgt mit einer asymmetrischen Public-Key-Verschlüsselungsmethode. Sie ermöglicht es, das Hacken von Datenbanken zu vermeiden.

Das Hauptmerkmal ist das Mischen der gesamten Datenmenge nach dem Zufallsprinzip, was die Entwicklung eines dezentralen Austauschnetzwerks ermöglicht. Anschließend werden die Daten in kleinere Teile aufgeteilt, so dass auch Geräte mit geringerer Kapazität am Trainingsprozess teilnehmen. Wenn kleine Geräte 1 Block erhalten, dann nutzen leistungsfähigere Geräte große Datencluster und Arrays von Blöcken.

SYPWAI ist ein erfolgreiches Startup des Neurosphere-Projekts, das sich auf die Entwicklung und das Training von neuronalen Netzen spezialisiert hat. Es bedient die größten Organisationen, die in verschiedenen Bereichen arbeiten, die mit der Nutzung der Technologie der künstlichen Intelligenz verbunden sind. Sie ist eine der am schnellsten wachsenden KI-Plattformen und wird täglich verbessert.

Die Aufgabe der Neurosphere ist es, die kontinuierliche Entwicklung und das Training von neuronalen Netzen zu gewährleisten. Aufgrund der aktiven Entwicklung und eines großen Stroms von Kunden, die solche Dienstleistungen benötigen, stellt SYPWAI Server auf der ganzen Welt auf und zieht zusätzlich neue Partner für ein schnelleres und genaueres Training an.

Eine große Anzahl hochqualifizierter Spezialisten mit schmalem Profil arbeitet in der Neurosphere

Der Raspberry Pi Zero W hat keinen KI-Beschleuniger, auch die anderen RasPIs nicht: https://de.wikipedia.org/wiki/Raspberry_Pi#Hardware

Aus dem Interview geht hervor, dass Sypwai sowas ist wie Amazons Mechanical Turk, damit reicht die Rechenleistung aus, weil ja nur die paar Datenpunkte trainiert werden müssen, die der Mensch vor Ort gelabelt hat. Wieso bietet man da kein Web-Interface für das Labeling an?

5€ pro Stunde ist Dritte-Welt-Niedriglohnniveau. Da gibt es vermutlich Probleme mit der DSGVO, dass man da nicht einfach persönliche Daten von EU-Bürgern zum Labeln hinschicken darf. Und mit dieser RasPI-basierten vor-Ort-Lösung vermeidet man das halt irgendwie. Ist also eine Lösung für ein politisches Problem. Technisch macht das keinen Sinn, deshalb ist es für mich auch so schwer zu verstehen.

Edit: Wieviel kostet so ein SOC für die Teilnahme am Labeling-Programm? Vielleicht wollen die auch nur einfach Arbeitssuchende abzocken. Wenn sie das für 100€ vertickern, im Einkauf sind das ~10€, und dann den Leuten sagen, tut uns leid, wir haben im Moment keine Arbeit für euch, schaut in eueren Vertrag, da steht nichts von einem Recht auf Arbeit, aber ihr habt ja immerhin noch unser Firmenlogo auf Acrylglas für 90€, viel Spaß damit, hehe.