#大数据学习笔记第2天# Java语言基础

# 大数据学习笔记第2天-Java语言基础 #
## 大纲 ##
– 关键字
– 标识符
– 常量和变量
– 运算符
– 流程控制
– 方法
– 数组

## 第一节课
– 关键字
– 标识符
– 常量与变量

## 第二节课
– 二进制
– 进制基本转换
– 负数的表现形式

## 第三节课
– 变量
– 基本数据类型

## 第四节课
– 基本数据类型之间的类型转换

## 关键字
Java系统中已经赋予了特殊含义的单词。特点:全部是小写字母。

Java中的保留字:现在暂时没有使用,以后可能会使用的单词,如:goto, const

### 关键字的分类:

– 定义数据类型;
– 定义流程控制;
– 布尔值;
– 引用类型空值;
– 访问权限修饰符;
– 用于定义类、方法、变量修饰符的关键字;
– 用于定义类与类之间关系的关键字;
– 用于定义建立实例及引用实例,判断实例的关键字;
– 用于异常处理的关键字;
– 用于包的关键字;
– 其他修饰关键字;

### 分析例子
Hello.java中用到的关键字:

Select Code
1
2
3
4
5
public class Hello{
	public static void main(String[] args){
		System.out.println("Hello World");
	}
}

关键字分析:

– public: 权限修饰符,说明该类是公共的;
– static: 静态类;
– class: 用于定义类
– void: 该方法返回空值;

## 标识符
用于给方法、变量、类、接口等命名的字符序列;

组成规则:

– 由26个英文字母大小写、$、下划线、数字组成;
– 不能以数字开头;
– 不可以使用关键字,但可以包含关键字;

Java中严格区分大小写,比如:main和Main是2个不同的方法;

### 标识符的命名规范
Java中的名称规范:

– 包名:多单词组成时,所有单词小写
– 类名、接口名:多单词组成时,所有单词首字母大写
– 变量名、方法名:多单词组成时,第一个单词的首字母小写,第二个单词开始每个单词的首字母大写
– final变量名:所有的字母大写,多单词时单词之间使用下划线分隔
– 在命名时,为了提高代码的可阅读性,需要做到见名知意;

## 常量与变量
常量表示不能改变的值;

Java中常量(6种字面量常量)的分类:

– 整型常量:直接出现的整数
– 小数常量:直接出现的小数
– 布尔值常量:只有2个值true或false
– 字符常量:用单引号括起来的,1个数字,1个字母或符号
– 字符串常量:将1个或多个字符用双引号括起来
– null常量:只有一个值 null

对于整数,有4种表现形式:

– 二进制:由0,1组成,满2进1,用`0b/0B`开头表示(大小写一样)
– 八进制:由0,7组成,满8进1,用`0`开头表示
– 十进制:由0,9组成,满10进1
– 十六进制:由0-9,A-F组成,满16进1,用`ox/0X`表示(大小写一样)

计算机底层是二进制存储数据的;

## 二进制
– 每个位只能表示 0 和 1 两种状态。
– 多个位组合起来可以表示更多的状态

## 十进制转二进制、八进制、十六进制
计算机以`8bit`作为存储数据的基本单位。 `1byte = 8bit`,1个字节等于8个比特。

– 1byte=8bit
– 1kb=1024byte
– 1M=1024kb
– 1G=1024M
– 1T=1024G
– 1P=1024T
– 1E=1024P

### 实现原理:
– 八进制:把二进制数三位一组,计算出对应的十进制数,组合起来就是对应的八进制数。
– 十六进制:把二进制数四位一组,计算出对应的十进制数,组合起来就是对应的十六进制数。

### 如何从十进制转化为二进制?
除以2,直到商为0,将余数倒排。

十进制转八进制,基数换成8;十进制转十六进制,基数换成16。注意:0-9只能表示最多10个数字,所以A:10, B:11, C:12, D:13, E:14, F:15, G:16。

## 二进制、八进制、十六进制转十进制
### 从二进制转十进制
位权展开法,每位上的数字x进制数的n次幂(从右往左,从0开始)求和。

### 从二进制转八进制
每三位为一组,最后组合成的就是八进制

### 从二进制转十六进制
每四位为一组,最后组合成的就是十六进制

了解:遵守 8421 法则。

## 负数的表现形式
– 补码:负数在计算机中都是以补码的形式存在的。最高位表示符号位:0正数、1负数。负数补码是对其原码取反加1,不包含符号位。
– 正数:原码,反码,补码(二进制)都相通。

### 求一个负数的补码
1. 求对应正数的原码
2. 把正数的原码符号位变1(负数的原码)
3. 把负数的原码除了符号位之外,取反(负数的反码)
4. 在反码基础上+1(负数的补码)

### 磨刀小试:-7的二进制
数字7,使用8421法则,是1+2+4,所以:7转化为二进制是 0000 0111

0000 0111 // 7转化为2进制
1000 0111 // 符号位变为1,表示是负数,得到负数的原码
1111 1000 // 将负数的原码,除了符号位进行取反,得到反码
1111 1001 // 将反码加1,最终得到负数的二进制

### 总结:快速求一个负数的补码规律
+7 0000 0111
-7 1111 1001

从右往左,遇到第1个1,往右原样,往左全取反。

## 变量
– 内存就是程序运行的地方,存放着数据和指令。
– 不同的数据存储在不同的空间,互不影响。
– 内存空间使用之前,必须先申请。

### 变量的概念:
– 内存中的一块存储区域。
– 该区域有自己的名称(变量名)和类型(数据类型)。

### 为什么要定义变量
就是为了使用内存空间。

### 变量的三个要素
– 类型(数据类型:能存放的数据类型)
– 变量(标识符:通过标识符可以访问内存空间里的值)
– 值(存储的内容)

### 定义变量的格式
– 数据类型 变量名=初始值;
– 数据类型 变量名; 变量名=初始值;

## 基本数据类型(四类八种)
整数默认是:int;小数默认是:double;字符串是String类(是引用数据类型)

– 数值型
– 整数类型:byte, short, int, long
– 浮点类型:float, double
– 字符型:char
– 布尔型:boolean

## 定义变量的注意事项
### 作用域
变量定义在哪个大括号里,它的作用就是所在的大括号,同一个作用域中,不能定义同名的变量(类型不同也不行);

### 初始化值
– 初始化有两种格式,定义时赋值,或先定义后赋值;
– 变量在使用前一定要赋值

### 可读性
一行上最好只定义一个变量(虽然一行上可以定义多个变量,如:int x,y,z;)

## 类型转换
– 类型相同的数才能进行运算。
– 不同类型的数进行运算,首先要进行类型转换,变成相同类型:
– 有的转换时系统自动完成的(自动类型转换/隐式类型转换);
– 有的转换时强制手动完成的(强制类型转换/显式类型转换);
– 什么时候用到强制类型转换(大范围转小范围)

举例:

– 自动类型转换:double d = 1 + 2.5; //整型自动转换为double类型
– 强制类型转换:byte b = (byte)128; //1byte的取值范围是: -128-127

当定义一个字符类型,赋值一个整数,会自动按照ASCII表进行转换:

### 表达式的数据类型自动提升:
– 所有byte, short, char型将提升为int型;
– char型参与运算实际上是对应的Unicode编码值;
– 如果表达式中还有更大表数范围的类型,则继续提升;
– boolean类型不参与数值运算,也不能和其他类型进行转换;

如果遇到:char 和 byte 相加的运算,会全部转换为整型,再进行运算

#大数据学习笔记第1天# Java概述

第一节课

软件&软件开发

计算机硬件常识,存储器分类:

  • Cache:高速缓存
  • 内存:Main Memory/Primary Memory
  • 硬盘:Secondary Memory: Hard Drive

硬盘上的文件不能直接访问,必须先加载到内存中,所有的程序都是在内存中运行的。

什么是计算机语音:

  • 人类语言:是人与人之间沟通的一种方式;
  • 计算机语言:人与计算交流的方式;

计算机发展简史:

  • 第一代:机器码
  • 第二代:汇编语言(出现了一些简单的英文单词)
  • 第三代:高级语言(更加接近人类语言,容易理解和记忆,如:C,C++,C#,JAVA)

人机交互方式

  • 图形界面GUI:Windows系统
  • 命令行方式CLI:DOS窗口,Bash命令

常用DOS命令

  • dir: 列出当前目录下的文件夹以及文件;
  • md: mkdir的缩写,创建一个空目录;
  • rd: remove directory简写,删除空目录;
  • cd: chdir的缩写,切换一个目录,进入目录;
  • del: 删除文件;
  • exit: 退出dos命令行;

第二节课

Java简介

  • SUN公司1995年推出的一门高级编程语言;
  • 2009年被Oracle公司收购;
  • 随着Java技术在Web方面的不断成熟,已经成为了Web应用程序的首选开发语言;
  • 是Hadoop等大数据开源框架首选开发语言;
  • 特点是:完全面向对象,安全可靠,与平台没有关系;

Java语言的三种技术架构:

  • JAVA EE 企业版 (主要用于开发Web应用程序)
  • JAVA SE 标准版 (大数据开发使用这种版本)
  • JAVE ME 小型版 (是为开发电子消费产品和嵌入式设备提供的解决方案,逐渐被淘汰)

Java语言的特点:跨平台性

平台指的是各种OS(操作系统Operation System),通过Java语言编写的应用程序在不同的操作系统平台上都可以运行。 Java之所以可以在各种平台上运行,是因为Java针对各种平台都开发了不同的JVM虚拟机(Java Virtual Machine)。同样的Java程序在不同的平台上都能运行,这就是Java的跨平台性。

Java开发环境安装与配置

明确什么是:JRE(java runtime environment), JDK(java development kit); 『下载』和『安装』JDK,『配置』环境变量(CMD中敲set可以查看环境变量); 安装完成后可以在命令行中输入java命令进行『验证』;

1. 什么是JRE(jvm+核心类库lib),JDK:JRE包括Java虚拟机,和Java程序所需要的核心类库等;

2. JDK(jre+工具tool)是提供给Java开发人员使用的,其中包含了Java的开发工具,也包括了JRE,所以安装了JDK,就不用再单独安装JRE了。

下载JDK(Java开发工具包)官网:www.oracle.com 注意操作系统以及版本的选择。

3. 安装JDK,建议安装路径最好不要有中文字符或者空格,提示安装JRE时,可以选择不安装。

4. 配置环境变量Path:‘我的电脑-属性-高级-环境变量’。编辑Path环境变量,加上java工具所在目录,各个路径之间用英文”;”分隔,建议放在最前面;打开DOS命令行,在任意目录下执行javac命令,如果出现javac的参数信息,配置成功。

第三节课

安装Notepad
安装完成后,配置字符集编码ANSI、文件关联.java、自动输入完成等;

第一个Java程序

一、编写之前调整系统,取消隐藏的已知类型文件的扩展名;

文本编辑器:Notepad++

  1. 将java代码编写到后缀名为.java的文件中
  2. 通过javac命令对该java文件进行编译
  3. 通过java命令运行生成的class文件

注意区分大小写。

二、编译:将源码文件编译成JVM可以识别的文件,在该源码文件目录下,通过javac编译工具,对Hello.java文件进行编译;如果程序没有出错,没有任何提示,但在当前目录下会出现一个Hello.class文件,该文件称为字节码文件,也是可执行的java的程序。

三、运行:通过运行工具java.exe对字节码文件进行执行,注意java命令后边的文件不用加.class,正常时就会输出“Hello World”

常见的错误:

  • 缺少大括号(不成对)
  • 字母大小写错误
  • 关键字单词拼写错误

代码:

Select Code
1
2
3
4
5
public class Hello{
	public static void main(String[] args){
		System.out.println("Hello World");
	}
}

如果在class前面加上public修饰,说明这是一个公共类,此时类名和文件名必须保持一致。一个源文件中可以包含多个类,编译之后,各自形成字节码文件。

编译后的文件名称为:Hello.class,内容如下图所示:

转义字符

  • \r: 回车,光标移到行首
  • \n: 换行符,光标移到到下一行
  • \t: tab键
  • \\: 输出一个\

第四节课

classpath:
可以在CMD中临时配置:set classpath=c:/;.
如果需要永久设置,则通过环境变量进行配置;

  • 既然class文件(字节码文件)是java的运行文件,可不可以实现在任意目录下都可以执行某一目录下的class文件呢?
  • 根据path环境变量的原理,可以定义一个名为classpath环境变量,将要运行的class文件所在的目录定义在该变量中;
  • JVM查找类文件的顺序:
    • 如果没有配置classpath环境变量,JVM只在当前目录下查找要运行的类文件;
    • 如果配置了classpath环境变量,JVM会先在classpath环境变量值得目录中查找要运行的类文件:
      • 值的结尾处如果加上分号,那么JVM在classpath目录下没有找到要指定的类文件,会在当前目录下再查找一次;
      • 值的结尾处如果没有加上分号,那么JVM在classpath目录下没有找到要指定的类文件,不会再当前目录下查找,即使当前目录下有,也不会运行;

注释:
用于注释、说明、解释程序的文字就是注释。主要是写给开发人员看的。

  • 单行 //
  • 多行 /* …. */
  • 文档注释 /** …. */

小白都可以看得懂的”第一个Java程序”

小白都可以看得懂的”第一个Java程序”

# Java简介
Java 是由Sun Microsystems公司于1995年5月推出的高级程序设计语言。Java可运行于多平台,如Windows, Mac OS, 及其他多种UNIX版本的系统。

# Java环境安装\编辑器准备
java开发工具包JDK:http://www.oracle.com/technetwork/cn/java/javase/downloads/index.html

在「环境变量」中配置三个属性的值:JAVA_HOME,CLASSPATH,Path。

– 变量名:JAVA_HOME
– 变量值:C:\Program Files (x86)\Java\jdk1.8.0_91 // 要根据自己的实际路径配置

– 变量名:CLASSPATH
– 变量值:.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar; //记得前面有个”.”表示当前目录下查找

– 变量名:Path
– 变量值:%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;

在CMD命令行中使用命令:java -version, java, javac 检测是否成功的安装了 Java JDK。

Java编辑器下载地址:http://www.eclipse.org/downloads/

# Java的第一个程序HelloWorld.java

如果你有过其他面向对象开发的编程,可以更加容易理解,Java本身也是一门面向对象的编程语言,整个的Java的程序可以理解为是对象的集合。

我们第一次接触,还不需要理解的非常深入,关键是能够找找Java的开发感觉。

比如这个简单的 「Hello World」入门的第一个代码,你要尽可能的彻底理解它,当然在后续我们学习Java的面向对象知识后,会比较深入的理解。

首先我们的代码文件名为:HelloWorld.java。

1. Java文件是 `.java` 后缀;
2. 文件名和类名要一致
3. 类名的首字母是要大写的,多个单词时,首字母要大写(遵循驼峰命名)。
4. 类名区分大小写。

在类当中定义了一个 main() 方法:

1. main() 方法是程序运行的入口;
2. public, static 是权限修饰的关键字(在后续的面向对象知识中会涉及到,暂时先不理解那么深入)
3. main(String[] args) 也可以写成 main(String args[]), 括号中()传入的是参数;不同于PHP的语法,在Java中定义变量时必须制定变量的类型,这里定义的是一个名词为 args 的字符串类型的数组。(关于更多的数据类型:诸如整型、浮点数、字符、布尔,会在后面的章节涉及到)

System.out.println(“Hello World”) 怎么理解呢?从它最早实现的功能会比较好理解,它的作用是输出“Hello World”字符串。

1. System.out.println() 是Java提供给我们的方法,关于更多的像字符串操作、数学运算等等…我们只需要死记硬背就可以了!至于为什么这么写,后面慢慢就明白啦!比如:”.”语法就是访问对象的方法的运算符。(先理解到这里,不要着急)
2. System.out.print() 少了 ln,2者之间最大的区别是,一个换行,一个不换行。(^_^, 自己敲代码会印象更深刻的哦,我也是通过敲代码发现2者之间的区别的!)

# 运行Java第一个程序

为了方便大家能够更加清楚的对比,我使用 git bash 来运行我们的第一段java代码,大家也可以使用 CMD 工具,效果是一样的。

– 首先在运行之前,当前文件夹只有:HelloWorld.java 文件;
– 执行命令:javac HelloWorld.java 就会生成 HelloWorld.class 文件(二进制文件)
– 然后执行命令:java HelloWorld 就会执行我们的java程序,输出Hello World。

通过这个实例,我们能够初步的理解Java代码的编写和运行过程啦!是不是觉得这种感觉很奇妙!

虽然,目前我们的代码只是最最简单的输出一个字符串,但是这是一个最好的开始!

彩蛋:前面我们看到的 abcde 纯字符的 HelloWorld.java 文件经过javac命令编译后的 HelloWorld.class 二进制(机器可以懂的代码)是长这样的:

写代码,就是每天进步一点点!