2024 in Review: Wichtige Highlights in Cloud-Datenbanken
Grace Collins
Solutions Engineer · Leapcell

Der heißeste Trend: Vektordatenbanken und KI
Die Fähigkeiten der KI, insbesondere von LLMs, scheinen keine sichtbare Obergrenze zu haben. Anwendungen, die auf diesen Technologien basieren, florieren in verschiedenen Branchen. Eine bedeutende Überschneidung zwischen Datenbanken und KI liegt in der Vektorspeicherung und -suche. Im Laufe des letzten Jahres hat fast jede Mainstream-Datenbank verwandte Funktionen eingeführt oder erweitert. Forrester hat ebenfalls eine Vorreiterrolle übernommen und die unabhängige Vector Database Wave veröffentlicht, in der die Vektorverarbeitungsfähigkeiten verschiedener Datenbanken bewertet werden.
Forresters Vector Database Wave
Im dritten Quartal dieses Jahres veröffentlichte Forrester seine Vector Database Wave, die Unternehmen wie Zilliz, DataStax, Microsoft, Amazon, Oracle und Pinecone vorstellte.
Inzwischen investieren fast alle Datenbank- oder Cloud-Anbieter in "Vektor"-Technologien. Diese KI-gestützten Innovationen entwickeln sich rasant, und der Wettbewerb in der Vektorspeicherung und -anwendungen ist noch lange nicht vorbei.
Vektorfunktionen, die von Datenbank- und Cloud-Anbietern eingeführt wurden
Im Jahr 2024 wetteiferten Datenbankanbieter darum, ihre Unterstützung für vektorbezogene Funktionen auf den Markt zu bringen. Bemerkenswerte Beispiele sind:
- pg_vector veröffentlichte Version 0.8, die in zahlreichen Projekten breite Anwendung findet.
- Azure führte seine Vektordatenbankerweiterung DiskANN ein, die in mehrere seiner Datenbankprodukte integriert ist.
- MariaDB begann mit Version 11.6 mit der vollständigen Unterstützung von Vektorfunktionen.
- OceanBase 4.3.3 fügte Unterstützung für Vektordatenspeicherung und -indizierung hinzu.
- MySQL 9.0 führte die Unterstützung für Vektorspeicherung ein.
- TiDB startete Vector Search (Beta) und integrierte Vektorfunktionen nahtlos in sein Ökosystem.
- Darüber hinaus enthalten fast alle Cloud-Anbieter, die PostgreSQL unterstützen, jetzt das pg_vector-Plugin.
Weitere KI-Datenbank-Integrationen
Neben Vektorfunktionen gewinnen auch andere KI-Datenbank-Integrationen, wie z. B. Text2SQL und Datenbankoptimierung, an Bedeutung. Beispiele hierfür sind:
- AWS Redshift unterstützt offiziell natürlichsprachlich generierte SQL-Abfragen über Amazon Q, das im Redshift Query Editor verfügbar ist.
- Copilot für Azure erweiterte seine Unterstützung auf Azure SQL und Azure Database für MySQL.
Graph-Datenbanken
Graph-Datenbanken sind zu einem wichtigen Bestandteil des Large Language Model (LLM)-Ökosystems geworden und haben im vergangenen Jahr ein rasantes Wachstum erlebt:
- Neo4j gab bekannt, dass sein ARR (Annual Recurring Revenue) 200 Millionen Dollar überstieg und sich in den letzten drei Jahren verdoppelt hat. Seine führende Rolle auf dem Markt für Graph-Technologien hat eine entscheidende Rolle bei der Verbesserung der Genauigkeit, Transparenz und Interpretierbarkeit von generativen KI-Ergebnissen gespielt.
- In diesem Jahr hat die ISO die neue ISO/IEC GQL (Graph Query Language) Norm herausgegeben, das "SQL" der Graph-Datenbanken, die Lücken in den bestehenden Normen für die Verarbeitung von Graph-Daten schließt. NebulaGraph war die erste verteilte Graph-Datenbank, die diesen Standard unterstützte.
Open-Source- und kommerzielle Entwicklungen
Zu Beginn dieses Jahres änderte die weit verbreitete Caching-Datenbank Redis ihre Open-Source-Lizenz. Ab Version 7.4 verwendete Redis die RSALv2+SSPLv1-Lizenz und wich von der BSD-Lizenz ab.
Kurz darauf wurde das Valkey-Projekt unter der Linux Foundation initiiert, mit Unterstützung von Unternehmen wie Amazon, Google und Oracle. Später im Jahr unterstützte AWS Valkey offiziell auf seiner Cloud-Plattform.
Mitteweile hat CockroachDB erhebliche Einschränkungen seiner Open-Source-Lizenz auferlegt. Für kleine Unternehmen (mit einem Jahresumsatz von weniger als 10 Millionen Dollar) bleibt die Software kostenlos, aber Unternehmen, die diese Umsatzgrenze überschreiten, müssen nun für die Nutzung bezahlen.
PostgreSQLs stetiger Aufstieg
Wie in den Vorjahren setzt PostgreSQL seinen langsamen und stetigen Aufstieg fort, während MySQL anscheinend stagniert.
In den DB-Engines-Rankings hat MySQL immer noch einen deutlichen Vorsprung. Die Dynamik von PostgreSQL ist jedoch offensichtlich, mit Innovationen wie pg_vector, die breite Anwendung finden, während MySQLs jüngste Unterstützung für Vektoren in Version 9.0 begrenzt bleibt.
Im JetBrains State of Developer Ecosystem Report 2024 zeigen sich ähnliche Trends:
- Die Akzeptanz von MySQL sank von 60 % im Jahr 2019 auf 52 % im Jahr 2024.
- Die Akzeptanz von PostgreSQL stieg von 30 % im Jahr 2019 auf 45 % im Jahr 2024.
Finanzierungshighlights im Datenbankbereich
Der Datenbanksektor verzeichnete im Jahr 2024 zahlreiche bemerkenswerte Finanzierungsereignisse:
- Tembo, ein PostgreSQL-Hosting-Startup, sammelte 14 Millionen Dollar in einer Serie-A-Finanzierungsrunde und bietet sowohl Open-Source-Produkte als auch Tembo Cloud für verwaltete PostgreSQL-Dienste an.
- OpenAI erwarb den Echtzeit-Analysedatenbankentwickler Rockset für geschätzte 500-1.000 Millionen Dollar, um die Echtzeit-Datensuche und -Analyse für große Modelle zu verbessern.
- ClickHouse erwarb das PostgreSQL-Datensynchronisierungs-Startup PeerDB, dessen Seed-Runde im Jahr 2023 3,6 Millionen Dollar einbrachte.
- Die Open-Source-Zeitreihendatenbank GreptimeDB sicherte sich eine multi-millionen-Dollar-Finanzierung und betonte die kosteneffiziente Echtzeit-Datenverarbeitung.
- K1 erwarb MariaDB und festigte damit seine Position als führender Software-Investor für kleine Unternehmen.
- Supabase sammelte 80 Millionen Dollar in einer Serie-C-Finanzierungsrunde, die sich auf PostgreSQL konzentriert und eine Reihe von Entwicklertools, einschließlich Vektordatenbanken, anbietet.
- ApertureDB sammelte 8 Millionen Dollar ein, um die Multi-Modal-Datenflussdienste für KI voranzutreiben.
Gartners Magic Quadrant für Datenbanken
Gartner hat kürzlich den 2024 Magic Quadrant für Datenbanken veröffentlicht. Die Führenden sind weiterhin Google, AWS, Azure und Oracle, wobei MongoDB, DataBricks und Snowflake Fortschritte in Richtung des oberen rechten Quadranten machen.
Wichtige Ankündigungen von Cloud-Anbietern
- Auf der AWS re
hat AWS Aurora DSQL auf den Markt gebracht, mit regionsübergreifenden, stark konsistenten, multiregionalen Lese- und Schreibfunktionen mit 99,999 % Verfügbarkeit (Multiregionen-Bereitstellung) und PostgreSQL-Kompatibilität. DynamoDB hat ebenfalls ähnliche regionsübergreifende Konsistenzfunktionen eingeführt. - Auf der Oracle CloudWorld betonte Larry Ellison eine Multi-Cloud-Strategie und stellte die Lösungen Oracle@Google, Oracle@Azure und Oracle@AWS vor.
- GCP konzentrierte sich auf die Verbesserung von AlloyDB und seinen grundlegenden Produkten, wie z. B. die Einführung von Enterprise Plus- und Enterprise-Versionen von Cloud SQL für SQL Server.
- Microsoft Azure priorisierte Cosmos DB und SQL Database und führte die DiskANN-Vektorindizierung für seine Vektordatenbanken ein.
Wir sind Leapcell, eine bessere Plattform für die Bereitstellung Ihrer Projekte, einschließlich solcher mit Cloud-Datenbanken.
Leapcell ist die Next-Gen Serverless Platform für Web Hosting, Async Tasks und Redis:
- Multi-Language Support
- Develop with JavaScript, Python, Go, or Rust.
- Stelle unbegrenzt Projekte kostenlos bereit
- bezahle nur für die Nutzung - keine Anfragen, keine Gebühren.
- Unschlagbare Kosteneffizienz
- Bezahlung nach Verbrauch ohne Leerlaufkosten.
- Beispiel: 25 US-Dollar unterstützen 6,94 Millionen Anfragen bei einer durchschnittlichen Antwortzeit von 60 ms.
- Optimierte Entwicklererfahrung
- Intuitive Benutzeroberfläche für mühelose Einrichtung.
- Vollständig automatisierte CI/CD-Pipelines und GitOps-Integration.
- Echtzeitmetriken und -protokollierung für umsetzbare Erkenntnisse.
- Mühelose Skalierbarkeit und hohe Leistung
- Auto-Scaling zur einfachen Bewältigung hoher Parallelität.
- Null Betriebsaufwand - konzentrieren Sie sich einfach auf den Aufbau.
Erfahren Sie mehr in der Dokumentation!
Folgen Sie uns auf X: @LeapcellHQ