Databricks übernimmt Tabular, um die Dateninteroperabilität in Lakehouses zu fördern
Databricks hat zugestimmt, Tabular zu übernehmen. Tabular ist ein Speicherplattformanbieter, geleitet von den Schöpfern von Apache Iceberg. Diese Übernahme soll die Dateninteroperabilität in Lakehouses fördern.
Durch die Übernahme wird Databricks die beiden führenden Open-Source-Tabellenformate für Lakehouses unterstützen. Außerdem wird die Unterstützung für seine UniForm-Tabellen erweitert.
Databricks plant, eng mit den Delta Lake– und Iceberg-Communities zusammenzuarbeiten. Ziel ist es, Formatkompatibilität für das Lakehouse zu schaffen. Dies soll sowohl kurzfristig innerhalb von Delta Lake UniForm geschehen als auch langfristig durch die Entwicklung eines einzigen, offenen und gemeinsamen Standards der Interoperabilität.
UniForm (Universal Format) ist ein neues Tabellenformat. Es bietet Interoperabilität über Delta Lake, Iceberg und Hudi und unterstützt die Iceberg-Restful-Katalogschnittstelle. Es wurde im Juni 2023 veröffentlicht.
Snowflake und Iceberg-Tabellen gegen Databricks und Delta Live-Tabellen
Analysten sehen die Tabular-Übernahme als Mittel für Databricks, eine robustere Interoperabilität zu unterstützen. Sie erklären, dass Unternehmen oft das Talent hinter wichtigen Open-Source-Projekten erwerben. Ziel ist es, eine starke Stimme in der Open-Source-Entwicklergemeinschaft des Projekts zu gewinnen.
Die Gründer von Tabular, die zu Databricks wechseln, könnten für eine verbesserte Kompatibilität zwischen Delta Lake und dem Iceberg-Standard sorgen. Dies würde Databricks einen Vorteil gegenüber Snowflake verschaffen. Es geht dabei um die Unterstützung von Kunden mit starkem Bezug auf externe Daten zur Snowflake-Plattform.
Der Wettbewerb zwischen Databricks und Snowflake umfasst nicht nur die beiden offenen Tabellenformate. Es geht auch um die generellen Datenmanagementfähigkeiten beider Unternehmen.
Snowflake zeigte in dieser Woche seinen Polaris-Katalog. Es wurde angekündigt, dass der Datenkatalog in den nächsten 90 Tagen Open Source gemacht werde. Der Polaris-Katalog ist ein Datenkatalog, der auf Iceberg aufgebaut ist. Er deckt den Bedarf von Unternehmen nach einem Anbieter-neutralen Angebot mit Datenverwaltungsfunktionen und unterstützenden interoperablen Abfrage-Engines.
Die Einführung des Polaris-Katalogs war eine Strategie von Snowflake, um Datenkatalogbenutzer von Konkurrent Databricks abzuwerben. Gleichzeitig soll die Attraktivität des eigenen Angebots gestärkt werden.
Databricks gegen Snowflake: Ein Wettbewerb bei Übernahmen
Databricks hat in letzter Zeit mehrere Unternehmen übernommen, um seine generativen KI-Angebote und Datenverwaltungsfähigkeiten zu stärken. Beispiele hierfür sind die Übernahmen von Lilac AI und MosaicML.
Auch Snowflake hat Unternehmen übernommen, die seine generativen KI-Angebote und Datenmanagementfähigkeiten verbessern. Dazu gehören die Übernahmen von Neeva und LeapYear.
Beide Unternehmen zeigen durch ihre Übernahmen, dass sie besser geeignet sind. Es geht darum, die Unternehmensdatenumgebung über eine Vielzahl von Datenformaten und -typen zu unterstützen. Databricks profitiert von der Übernahme von Tabular. Dies zeigt, dass es Iceberg unterstützen kann, das möglicherweise das am meisten unterstützte Tabellenformat ist.
Fazit
Die Übernahme von Tabular durch Databricks ist ein bedeutender Schritt zur Förderung der Dateninteroperabilität in Lakehouses. Durch die Unterstützung der beiden führenden Open-Source-Tabellenformate und die Entwicklung des UniForm-Formats zeigt Databricks sein Engagement für offene Standards und Zusammenarbeit in der Datencommunity. Der Wettbewerb mit Snowflake bleibt intensiv. Beide Unternehmen erweitern ihre Fähigkeiten im Bereich Datenmanagement und generative KI durch strategische Übernahmen. Letztendlich profitieren die Kunden von diesen Bemühungen, da sie Zugang zu fortschrittlichen und interoperablen Datenlösungen erhalten.