pyspark에서 .lit()는 문자열의 값을 모두 채워서 컬럼으로 만들어주는 메소드입니다.
다음과 같이 사용합니다.
1 2 3 4 5 6 7 8 9 |
import pyspark from pyspark.sql import SparkSession spark = SparkSession.builder.appName('SparkByExamples.com').getOrCreate() data = [("111",50000),("222",60000),("333",40000)] columns= ["EmpId","Salary"] df = spark.createDataFrame(data = data, schema = columns) |
더 자세한 것은 아래의 블로그를 참고하세요.