当前位置:首页 - Spark

pyspark dataframe 列值转小写

作者:高景洋 日期:2021-07-22 15:02:30 浏览次数:2740

要通过 pyspark 将dataframe中的某一列值转换为小写,需要如何操作?


ps: 要通过pyspark 对dataframe 中的值做类型转换 或 值处理,不要去想python的处理方法,spark中有自己数据类型,也有自己的值处理方法。


直接看如下代码:

import pyspark.sql.functions as F

list_hbase_product_dataframe = fdc.select('Url','WebsiteID').where('WebsiteID in ({})'.format(','.join(list_schedule_website_default_id_str))).withColumn('Url',F.lower(F.col("Url")))


划重点:F.lower(F.col("Url"))
本文永久性链接:
<a href="http://r4.com.cn/art195.aspx">pyspark dataframe 列值转小写</a>
当前header:Host: r4.com.cn X-Host1: r4.com.cn X-Host2: r4.com.cn X-Host3: 127.0.0.1:8080 X-Forwarded-For: 3.142.194.124 X-Real-Ip: 3.142.194.124 X-Domain: r4.com.cn X-Request: GET /art195.aspx HTTP/1.1 X-Request-Uri: /art195.aspx Connection: close Accept: */* User-Agent: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com) Accept-Encoding: gzip, br, zstd, deflate