Heim >Betrieb und Instandhaltung >Apache >Was ist Apache Kafka-Datenerfassung?

Was ist Apache Kafka-Datenerfassung?

藏色散人Original: 2019-09-29 10:45:265640Durchsuche

Was ist die Apache-Kafka-Datenerfassung?

Apache Kafka – Einführung

Apache Kafka entstand bei LinkedIn und wurde 2011 zu einem Open-Source-Apache-Projekt und dann zu einem erstklassigen Projekt in Apache im Jahr 2012. Kafka ist in Scala und Java geschrieben. Apache Kafka ist ein fehlertolerantes Nachrichtensystem, das auf Publish-and-Subscribe basiert. Es ist schnell, skalierbar und verteilt.

In diesem Tutorial werden die Prinzipien, die Installation und der Betrieb von Kafka erläutert und anschließend die Bereitstellung des Kafka-Clusters vorgestellt. Abschließend befassen wir uns mit Echtzeitanwendungen und der Integration mit Big-Data-Technologien.

Bevor Sie mit diesem Tutorial fortfahren, müssen Sie über gute Kenntnisse von Java, Scala, verteilten Messagingsystemen und der Linux-Umgebung verfügen.

Bei Big Data werden große Datenmengen verwendet. Was die Daten betrifft, stehen wir vor zwei großen Herausforderungen. Die erste Herausforderung besteht darin, große Datenmengen zu sammeln, und die zweite Herausforderung besteht in der Analyse der gesammelten Daten. Um diese Herausforderungen zu meistern, benötigen Sie ein Nachrichtensystem.

Kafka ist für verteilte Hochdurchsatzsysteme konzipiert. Kafka eignet sich tendenziell gut als Alternative zu traditionelleren Mail-Brokern. Im Vergleich zu anderen Messaging-Systemen verfügt Kafka über einen besseren Durchsatz, integrierte Partitionierung, Replikation und inhärente Fehlertoleranz, was es ideal für umfangreiche Nachrichtenverarbeitungsanwendungen macht.

Was ist ein E-Mail-System?

Das Nachrichtensystem kümmert sich um die Übertragung von Daten von einer Anwendung zu einer anderen, sodass sich Anwendungen auf die Daten konzentrieren können, sich aber keine Gedanken darüber machen müssen, wie sie diese weitergeben. Verteiltes Messaging basiert auf dem Konzept zuverlässiger Nachrichtenwarteschlangen. Nachrichten werden asynchron zwischen der Clientanwendung und dem Nachrichtensystem in die Warteschlange gestellt. Es stehen zwei Arten von Messaging-Mustern zur Verfügung: eines ist ein Punkt-zu-Punkt-Messaging-System und das andere ist ein Publish-Subscribe-Messaging-System (Pub-Sub). Die meisten Nachrichtenmuster folgen Pub-Sub.

Peer-to-Peer-Nachrichtensystem

In einem Peer-to-Peer-System bleiben Nachrichten in Warteschlangen. Ein oder mehrere Verbraucher können Nachrichten aus der Warteschlange konsumieren, eine bestimmte Nachricht kann jedoch höchstens von einem Verbraucher konsumiert werden. Sobald ein Verbraucher eine Nachricht aus einer Warteschlange liest, verschwindet sie aus dieser Warteschlange. Ein typisches Beispiel für dieses System ist ein Auftragsverarbeitungssystem, bei dem jede Bestellung von einem Auftragsbearbeiter bearbeitet wird, es jedoch auch mehrere Auftragsbearbeiter gleichzeitig arbeiten können. Das folgende Diagramm zeigt den Aufbau.