DataStreamApi简介

什么可以转化为流
flink的java和scala DataStream API可以将任何可序列化的对象转化为流
1、flink自带的序列化器有
基本类型:String、Long、Integer、Boolean、Array
复合类型:Tuples、POJOs 和 Scala case classes
2、并且flink会交给kryo序列化其他类型。也可以将其他序列化器和 Flink 一起使用。特别是有良好支持的 Avro。
POJOS

如果满足以下条件,flink会将数据类型识别为POJO类型(并允许"按名称"字段引用)

  • 公有且独立
  • 有公有的无参构造
  • 类及父类中所有的不被static、transient修饰的属性要么是公有的且不被final修饰,要么包含公有的getter和setter方法
stream执行环境

DataStream API将应用构建为一个job graph,并附加到StreamExcutionEnvironment。当调用 env.execute() 时此 graph 就被打包并发送到 JobManager 上,后者对作业并行处理并将其子任务分发给 Task Manager 来执行。每个作业的并行子任务将在 task slot 中执行。如果没有调用 execute(),应用就不会运行

在这里插入图片描述

基本的stream source
1、数据类型转换
2、socket接收
3、读取文件
基本的stream sink
使用print()方法打印结果到task manager的日志中。会对流中的每个元素都调用toString()方法