誰在以太坊區塊鏈上回圈交易？TuGraph+Kafka的0元流圖解決方案-有解無憂

都在說資料已經成為新時代的生產資料，

但隨著大資料和人工智能等技術的發展，即便人們都知道資料的價值日益凸顯，卻無法憑借一己之力獲取和分析如此大規模的資料，

要想富，先修路，要想利用新時代的資料致富，也必須要有趁手的工具，只有合適的工具才能完成大規模資料的采集、清洗、存盤、處理和可視化等各個環節，只有具備這樣的工具，才能更好地利用資料來推動經濟社會發展，并為人類創造更多的價值，

undefined

現如今，免費的，螞蟻集團圖計算團隊開源的超大規模流圖處理系統——TuGraph-Analytics，正成為一款專注于圖計算領域的開源資料處理工具，我們從一個簡單的問題開始，讓你體會TuGraph-Analytics的強大之處，

“誰在以太坊的區塊鏈上進行回圈交易？”

如何回答這個問題？

大資料領域的同學可能會立即舉手，Kafka給我上，Flink給我上，實在不行Spark... 這些系統在處理大規模資料時，作業流程通常非常長，開發效率較低，無法迅速地回應用戶的需求，各有各的長處，各有各的毛病，因此，我們需要尋找全新的資料分析工具，以提高大資料領域的作業效率，并更好地應對日益復雜和多變的資料處理挑戰，

新的工具？那么試試GPT？

Q：誰在以太坊的區塊鏈上進行回圈交易？

GPT：這個問題需要進行資料分析，涉及到大量的以太坊交易資料，如果要確定誰在以太坊的區塊鏈上進行回圈交易，可以通過以下步驟：

獲取以太坊的交易資料，包括交易哈希、發送方地址、接收方地址、交易型別和交易金額等資訊，
對交易資料進行清洗和處理，去掉無效資料和重復資料等，
利用圖計算等技術，構建以太坊交易網路，并對交易網路進行分析，識別出交易中的回圈交易，
進一步分析回圈交易的發送方地址和接收方地址，識別出誰在以太坊的區塊鏈上進行回圈交易，

需要注意的是，由于以太坊區塊鏈的去中心化特性，交易資料的獲取和分析可能存在一定的難度和挑戰，

姿勢不對，再來一次，

Q：誰在以太坊的區塊鏈上進行回圈交易？一句話回答

GPT：無法通過一句話回答，需要進行資料分析，

可見，雖然GPT等人工智能在自然語言處理和影像識別等方面已經取得了顯著進展，但在資料洞察方面仍然存在挑戰，因為資料洞察往往需要結合具體的業務背景和領域知識，而這些人類經驗和智慧難以完全被機器模擬和替代，此外，在資料清洗、資料預處理、特征提取和建模等關鍵步驟上，仍需要人類專家進行干預和優化，

今天，我們使用開源的TuGraph-Analytics與流式訊息系統Kafka，不僅能夠很好回答誰在以太坊的區塊鏈上進行回圈交易，而且能夠搭建秒級實時的金融級解決方案，客官且看----

何為回圈交易？

來看這個例子

undefined

圖中有7個不同顏色的點代表交易賬戶，每個賬戶對應以太坊上的一個錢包地址，一個賬戶轉出到另一個賬戶的程序，表示為圖中有方向的邊，這個圖中共有8筆交易構成一個交易網路，

undefined

將交易頭尾相連，能夠找到回傳起點的回圈，就可以視為回圈交易，

回圈交易通常是指通過多個交易步驟，從而實作利用價格差異來獲取利潤的一種交易方式，其程序包括在不同的市場或不同的時間段內進行買賣行為，從而獲得利潤，在交易網路圖中，可以使用環路檢測演算法來發現潛在的回圈交易路徑，并檢索這條路徑上的賬戶就能夠知道哪些賬戶可能參與了回圈交易，

可是，當一筆新的交易發生時——
undefined

可見，環路檢測并不是一勞永逸的靜態圖演算法，隨著訊息實時不斷到來，交易網路圖中的最新環路不斷發生變化，如果關心每一筆交易產生的交易環路，這將成為一個極其復雜的問題，

以太坊是基于區塊鏈技術的智能合約平臺，其交易速度取決于眾多的參與者，交易成交速度通常在15秒到1分鐘之間，交易吞吐量可以達到每秒數十到數百筆交易，但別忘了，以太坊還有海量的歷史交易資料，相當于存在一個相當復雜的”底圖“，回圈交易問題不僅需要考慮新的交易，還必須綜合分析歷史上所有的交易！

這就是為什么強如GPT也無法一句話回答這個問題的原因，

那么真的能夠在每筆交易發生時實時地檢測回圈交易的產生嗎？

實際上，使用專業的圖計算系統TuGraph-Analytics，這個問題只需要幾十行代碼即可解決，還能夠迅速結合Kafka搭建起交易聽單->交易網路生成->實時回圈交易檢出->給下游發送訊息完整的金融級實時解決方案，更關鍵的是，這一切都是免費的~ 感謝開源！

我們在TuGraph-Analytics新建一個圖計算作業，只需大約40行代碼，即可完成整個端到端流程，
undefined

代碼描述如下，需要自取，

在這短短40行中，我們創建了以太坊交易的整個底圖，命名為ethereum_transaction_network，把來自Kafka的實時交易流table_new_trade不斷添加到命名為ethereum_transaction_network的圖中，

接下來，每當有新的交易到達的時刻，都將觸發一次3跳回圈交易模式的檢查，把更新的結果存入位于Kafka的外部表tbl_circular_trade，可以很方便地分發給下游組件，

實時交易資料我們采用了XBlock-ETH: Extracting and exploring blockchain data from Ethereum這篇論文整理的真實的以太坊區塊資料，在這個Demo中把以太坊地址隱去，以一個數字替代，即每個數字代表以太坊的一個錢包地址，相同的數字表示相同的地址，生成的回圈路徑結果我們拼接成一個字串，方便觀察，

set geaflow.dsl.window.size = 200;
-- 以太坊交易的底圖
CREATE GRAPH IF NOT EXISTS ethereum_transaction_network (
	Vertex address (id bigint ID),
	Edge trade (srcId bigint SOURCE ID, targetId bigint DESTINATION ID, mount double)
) WITH (
	storeType='rocksdb'
);

-- 從Kafka監聽最新的交易
CREATE TABLE IF NOT EXISTS table_new_trade (
  srcId bigint, targetId bigint, mount double
) WITH (
	type='kafka',
  geaflow.dsl.kafka.servers = '{your.kafka.server.ip}:9092',
	geaflow.dsl.kafka.topic = 'tbl-trade'
);

-- 將新的交易添加到底圖
INSERT INTO ethereum_transaction_network.address SELECT srcId FROM table_new_trade;
INSERT INTO ethereum_transaction_network.address SELECT targetId FROM table_new_trade;
INSERT INTO ethereum_transaction_network.trade SELECT srcId, targetId, mount FROM table_new_trade;

-- 一張外部表連接Kafka以輸出檢出的回圈交易結果
CREATE TABLE IF NOT EXISTS tbl_circular_trade (
	  circular VARCHAR
) WITH (
	type='kafka',
  geaflow.dsl.kafka.servers = '{your.kafka.server.ip}:9092',
	geaflow.dsl.kafka.topic = 'tbl-circular-trade'
);

-- 使用以太坊交易圖進行實時查詢
USE GRAPH ethereum_transaction_network;

-- 查詢3跳回圈交易模式存入位于Kafka的外部表
INSERT INTO tbl_circular_trade
MATCH (v1)-[:trade]->(v2)-[:trade]->(v3)-[:trade]->(v4)
WHERE v1.id = v4.id AND v1.id != v2.id AND v1.id != v3.id AND v2.id != v3.id
RETURN concat(CAST(v1.id as VARCHAR), '->', CAST(v2.id as VARCHAR),
       '->', CAST(v3.id as VARCHAR), '->', CAST(v4.id as VARCHAR)) AS circular
;

實機演示！

打開一個Kafka Producer，產生訊息流，將交易不斷發送給Kafka，如左側終端視窗所示，平均1秒左右，最新的圖中回圈交易檢出結果就列印在右側的Kafka Consumer視窗中，
undefined

當添加一些新的交易日志時，右側的Kafka Consumer視窗中也實時更新了新的回圈交易檢出結果，回應十分迅速，

截屏2023-06-15 23.48.46的副本.png

以上便是開源圖計算平臺TuGraph Analytics結合Kafka，快速搭建的以太坊回圈交易檢出解決方案，雖然這只是一個小小的demo，但實機演示中強大的圖計算語法和系統性能可見一斑，大大較低了我們普通人搭建圖計算應用的難度和成本，

說多不如現在開始行動，TuGraph Analytics是你不容錯過的利器，現在就趕快訪問https://github.com/TuGraph-family/tugraph-analytics，親自體驗TuGraph Analytics的魅力吧！此外，我們歡迎各位參與到開源貢獻中來，為社區貢獻自己的智慧和代碼，共同促進國產圖計算系統的發展，

[參考文獻]
P. Zheng, Z. Zheng, J. Wu, and H.-N. Dai, “XBlock-ETH: Extracting and exploring blockchain data from Ethereum,” IEEE Open J. Comput. Soc., vol. 1, pp. 95–106, May 2020, doi: 10.1109/OJCS.2020.2990458.

轉載請註明出處，本文鏈接：https://www.uj5u.com/shujuku/556448.html

標籤：大數據

上一篇：干貨｜三個維度詳解 Taier 本地除錯原理和實踐

下一篇：返回列表