hive自定义函数过滤emoj表情符
生活随笔
收集整理的這篇文章主要介紹了
hive自定义函数过滤emoj表情符
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
mysql插入數據問題:java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x98\x8D\xE8\xBE…’ for column ‘job_title’ at row 1
問題原因:
數據中存在Emoj表情內容,每個字符占用4個字節,在Mysql中utf-8默認最大支持3個字節,超長了,所以報錯了。
解決辦法:
(1)在較新版本的Mysql上可選擇修改數據類型為utf8mb4
(2)hive 數據處理過濾掉Emoj表情內容(Emoj數據一般無用),處理完再集成到MySQL數據庫。用自定義函數
create temporary function StringFilter as ‘UppUDF.StringFilter’
using jar ‘hdfs://namenodeha/user/p66_u1038_upp_ludp1/tmp/StringFilter.jar’;
自定義函數代碼如下:
總結
以上是生活随笔為你收集整理的hive自定义函数过滤emoj表情符的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: RT-Thread柿饼控件(2)-- B
- 下一篇: 和平精英追猎模式怎么没了 和平精英追猎下