都在說資料已經成為新時代的生產資料,
但隨著大資料和人工智能等技術的發展,即便人們都知道資料的價值日益凸顯,卻無法憑借一己之力獲取和分析如此大規模的資料,
要想富,先修路,要想利用新時代的資料致富,也必須要有趁手的工具,只有合適的工具才能完成大規模資料的采集、清洗、存盤、處理和可視化等各個環節,只有具備這樣的工具,才能更好地利用資料來推動經濟社會發展,并為人類創造更多的價值,
現如今,免費的,螞蟻集團圖計算團隊開源的超大規模流圖處理系統——TuGraph-Analytics,正成為一款專注于圖計算領域的開源資料處理工具,我們從一個簡單的問題開始,讓你體會TuGraph-Analytics的強大之處,
“誰在以太坊的區塊鏈上進行回圈交易?”
如何回答這個問題?
大資料領域的同學可能會立即舉手,Kafka給我上,Flink給我上,實在不行Spark... 這些系統在處理大規模資料時,作業流程通常非常長,開發效率較低,無法迅速地回應用戶的需求,各有各的長處,各有各的毛病,因此,我們需要尋找全新的資料分析工具,以提高大資料領域的作業效率,并更好地應對日益復雜和多變的資料處理挑戰,
新的工具?那么試試GPT?
Q:誰在以太坊的區塊鏈上進行回圈交易?
GPT:這個問題需要進行資料分析,涉及到大量的以太坊交易資料,如果要確定誰在以太坊的區塊鏈上進行回圈交易,可以通過以下步驟:
獲取以太坊的交易資料,包括交易哈希、發送方地址、接收方地址、交易型別和交易金額等資訊,
對交易資料進行清洗和處理,去掉無效資料和重復資料等,
利用圖計算等技術,構建以太坊交易網路,并對交易網路進行分析,識別出交易中的回圈交易,
進一步分析回圈交易的發送方地址和接收方地址,識別出誰在以太坊的區塊鏈上進行回圈交易,
需要注意的是,由于以太坊區塊鏈的去中心化特性,交易資料的獲取和分析可能存在一定的難度和挑戰,
姿勢不對,再來一次,
Q:誰在以太坊的區塊鏈上進行回圈交易?一句話回答
GPT:無法通過一句話回答,需要進行資料分析,
可見,雖然GPT等人工智能在自然語言處理和影像識別等方面已經取得了顯著進展,但在資料洞察方面仍然存在挑戰,因為資料洞察往往需要結合具體的業務背景和領域知識,而這些人類經驗和智慧難以完全被機器模擬和替代,此外,在資料清洗、資料預處理、特征提取和建模等關鍵步驟上,仍需要人類專家進行干預和優化,
今天,我們使用開源的TuGraph-Analytics與流式訊息系統Kafka,不僅能夠很好回答誰在以太坊的區塊鏈上進行回圈交易,而且能夠搭建秒級實時的金融級解決方案,客官且看----
何為回圈交易?
來看這個例子
圖中有7個不同顏色的點代表交易賬戶,每個賬戶對應以太坊上的一個錢包地址,一個賬戶轉出到另一個賬戶的程序,表示為圖中有方向的邊,這個圖中共有8筆交易構成一個交易網路,
將交易頭尾相連,能夠找到回傳起點的回圈,就可以視為回圈交易,
回圈交易通常是指通過多個交易步驟,從而實作利用價格差異來獲取利潤的一種交易方式,其程序包括在不同的市場或不同的時間段內進行買賣行為,從而獲得利潤,在交易網路圖中,可以使用環路檢測演算法來發現潛在的回圈交易路徑,并檢索這條路徑上的賬戶就能夠知道哪些賬戶可能參與了回圈交易,
可是,當一筆新的交易發生時——
可見,環路檢測并不是一勞永逸的靜態圖演算法,隨著訊息實時不斷到來,交易網路圖中的最新環路不斷發生變化,如果關心每一筆交易產生的交易環路,這將成為一個極其復雜的問題,
以太坊是基于區塊鏈技術的智能合約平臺,其交易速度取決于眾多的參與者,交易成交速度通常在15秒到1分鐘之間,交易吞吐量可以達到每秒數十到數百筆交易,但別忘了,以太坊還有海量的歷史交易資料,相當于存在一個相當復雜的”底圖“,回圈交易問題不僅需要考慮新的交易,還必須綜合分析歷史上所有的交易!
這就是為什么強如GPT也無法一句話回答這個問題的原因,
那么真的能夠在每筆交易發生時實時地檢測回圈交易的產生嗎?
實際上,使用專業的圖計算系統TuGraph-Analytics,這個問題只需要幾十行代碼即可解決,還能夠迅速結合Kafka搭建起交易聽單->交易網路生成->實時回圈交易檢出->給下游發送訊息完整的金融級實時解決方案,更關鍵的是,這一切都是免費的~ 感謝開源!
我們在TuGraph-Analytics新建一個圖計算作業,只需大約40行代碼,即可完成整個端到端流程,
代碼描述如下,需要自取,
在這短短40行中,我們創建了以太坊交易的整個底圖,命名為ethereum_transaction_network,把來自Kafka的實時交易流table_new_trade不斷添加到命名為ethereum_transaction_network的圖中,
接下來,每當有新的交易到達的時刻,都將觸發一次3跳回圈交易模式的檢查,把更新的結果存入位于Kafka的外部表tbl_circular_trade,可以很方便地分發給下游組件,
實時交易資料我們采用了XBlock-ETH: Extracting and exploring blockchain data from Ethereum這篇論文整理的真實的以太坊區塊資料,在這個Demo中把以太坊地址隱去,以一個數字替代,即每個數字代表以太坊的一個錢包地址,相同的數字表示相同的地址,生成的回圈路徑結果我們拼接成一個字串,方便觀察,
set geaflow.dsl.window.size = 200;
-- 以太坊交易的底圖
CREATE GRAPH IF NOT EXISTS ethereum_transaction_network (
Vertex address (id bigint ID),
Edge trade (srcId bigint SOURCE ID, targetId bigint DESTINATION ID, mount double)
) WITH (
storeType='rocksdb'
);
-- 從Kafka監聽最新的交易
CREATE TABLE IF NOT EXISTS table_new_trade (
srcId bigint, targetId bigint, mount double
) WITH (
type='kafka',
geaflow.dsl.kafka.servers = '{your.kafka.server.ip}:9092',
geaflow.dsl.kafka.topic = 'tbl-trade'
);
-- 將新的交易添加到底圖
INSERT INTO ethereum_transaction_network.address SELECT srcId FROM table_new_trade;
INSERT INTO ethereum_transaction_network.address SELECT targetId FROM table_new_trade;
INSERT INTO ethereum_transaction_network.trade SELECT srcId, targetId, mount FROM table_new_trade;
-- 一張外部表連接Kafka以輸出檢出的回圈交易結果
CREATE TABLE IF NOT EXISTS tbl_circular_trade (
circular VARCHAR
) WITH (
type='kafka',
geaflow.dsl.kafka.servers = '{your.kafka.server.ip}:9092',
geaflow.dsl.kafka.topic = 'tbl-circular-trade'
);
-- 使用以太坊交易圖進行實時查詢
USE GRAPH ethereum_transaction_network;
-- 查詢3跳回圈交易模式存入位于Kafka的外部表
INSERT INTO tbl_circular_trade
MATCH (v1)-[:trade]->(v2)-[:trade]->(v3)-[:trade]->(v4)
WHERE v1.id = v4.id AND v1.id != v2.id AND v1.id != v3.id AND v2.id != v3.id
RETURN concat(CAST(v1.id as VARCHAR), '->', CAST(v2.id as VARCHAR),
'->', CAST(v3.id as VARCHAR), '->', CAST(v4.id as VARCHAR)) AS circular
;
實機演示!
打開一個Kafka Producer,產生訊息流,將交易不斷發送給Kafka,如左側終端視窗所示,平均1秒左右,最新的圖中回圈交易檢出結果就列印在右側的Kafka Consumer視窗中,
當添加一些新的交易日志時,右側的Kafka Consumer視窗中也實時更新了新的回圈交易檢出結果,回應十分迅速,
以上便是開源圖計算平臺TuGraph Analytics結合Kafka,快速搭建的以太坊回圈交易檢出解決方案,雖然這只是一個小小的demo,但實機演示中強大的圖計算語法和系統性能可見一斑,大大較低了我們普通人搭建圖計算應用的難度和成本,
說多不如現在開始行動,TuGraph Analytics是你不容錯過的利器,現在就趕快訪問https://github.com/TuGraph-family/tugraph-analytics,親自體驗TuGraph Analytics的魅力吧!此外,我們歡迎各位參與到開源貢獻中來,為社區貢獻自己的智慧和代碼,共同促進國產圖計算系統的發展,
[參考文獻]
P. Zheng, Z. Zheng, J. Wu, and H.-N. Dai, “XBlock-ETH: Extracting and exploring blockchain data from Ethereum,” IEEE Open J. Comput. Soc., vol. 1, pp. 95–106, May 2020, doi: 10.1109/OJCS.2020.2990458.
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/556448.html
標籤:大數據
下一篇:返回列表