OCaml从入门到放弃

[TOC]

0. 前言

学习函数式语言

1. 注释与输入输出

OCaml注释如下:

1
(* hello world *)

输入输出如下:

  • 输入

    • read_int(): 读入一个整数
    • read_float(): 读入一个浮点数
    • read_line(): 读入一个字符串
  • 输出

    • print_char 'a': 打印字符
    • print_int 2: 打印数字
    • print_float 3.4: 打印浮点数
    • print_newline(): 打印换行
    • print_string "hello world": 打印字符串
    • print_endline "hello world": 打印字符串,并换行
    • Printf.printf "int %i, float %f, char %c, string %s\n" 3 3.2 'a' "ok";;: 打印格式化字符串

(注:OCaml中的函数调用:不需要括号,除非无参数时才需要;各参数之间用空格隔开。)

2. 编译与运行

OCaml代码文件以.ml结尾。

  • 解释运行:ocaml xxx.ml
  • 编译运行
    • 编译生成可重定位文件:
      • 字节码:ocamlc -c xxx.ml -o xxx.cmo
      • 目标码:ocamlc -c xxx.ml -o xxx.o
    • 链接生成目标文件:ocamlc -o xxx xxx.cmo
    • 直接生成目标文件:
      • 字节码:ocamlc -o xxx xxx.ml
      • 目标码:ocamlopt -o xxx xxx.ml

3. 变量

变量名开头字母不能大写,若大写则会被当作联合类型中的构造子。

3.1. 基本类型

  • int: 整数类型
  • float: 浮点类型,浮点常数必须带小数点.,否则会被视为int类型
  • char: 字符类型
  • string: 字符串类型
  • unit: 啥都不是类型

在OCaml中,没有强制类型转换,整型只能与整型变量做运算。

若要类型转换,需使用相应函数,如下:

  • float_of_int 1: int => float
  • int_of_float 2.6: float => int
  • int_of_string "-23": string => int
  • float_of_string "1.2e3": string => float
  • string_of_int 12: int => string
  • string_of_float (-2.3): float => string

字符与ASCII码:

  • int_of_char 'x': 获取字符x的ASCII码值
  • char_of_int 120: 把ASCII码转换到字符

3.2. let 定义

  • let <变量1> = <表达式1> and <变量2> = <表达式2>: 全局定义

    • 必须赋初值
    • 可重复定义一个变量
    • 不能在表达式内部使用
  • let <变量1> = <表达式1> and <变量2> = <表达式2> in <表达式3>: 局部定义

    • 必须赋初值
    • 可重复定义一个变量
    • 可在表达式内部使用
    • 变量1,2作用域局限于表达式3

注意:let定义的变量是无法修改!!!修改需要使用命令式的方式,后文细说。

3.3. 多态类型

4. 表达式

4.1. 算术运算

  • (a/b) * b + (a mod b): 整型运算+, -, *, /, mod
  • 4e2 *. 2. /. 3. +. 1.: 浮点型运算,运算符必须带小数点.

4.2. 逻辑运算

  • not true: 非
  • true && false: 与
  • true || false: 或

4.3. 比较运算

>, <, >=, <=如常

相等与不等:

  • = and <>: 结构化比较,对比结构内部的子元素
  • == and !=: 物理比较,比较变量在内存中的存储地址(即比较地址)

对于非结构化数据,两种相等于不等相同。基本类型中,整型和字符非结构化数据浮点型和字符串都是结构化数据

4.4. 位运算

  • op1 land op2: 按位与
  • op1 lor op2: 按位或
  • op1 lxor op2: 按位异或
  • op1 lsl op2: op1左移op2位
  • op1 lsr op2: op1右移op2位
  • op1 asr op2: op1算术右移op2位

4.5. if 表达式

格式:

1
if <条件表达式> then <表达式1> [ else <表达式2> ]

示例:

1
2
3
4
5
# if 1<2 then
true && false
else
true || false;;
- : bool = false

4.6. while 表达式

纯函数式语言没有循环。惊不惊喜,意不意外。

需要循环完成的工作,可以通过递归函数来完成。

4.7. 模式匹配表达式

强大至极

格式:

1
2
3
4
5
match <表达式> with
| <模式1> [when <条件1>] -> <表达式1> (* 第一个 | 可以省略 *)
| <模式2> [when <条件2>] -> <表达式2>
...
| <模式n> [when <条件n>] -> <表达式n>

基础使用示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
(* 取反 *)
let neg x =
match x with
| true -> false
| false -> true
;;
(* 类型:val neg : bool -> bool = <fun> *)


(* 是否为零 *)
let is_zero x =
match x with
| 0 -> true
| _ -> false (* 可以使用通配符 *)
;;
(* 类型:val is_zero : int -> bool = <fun> *)


(* 异或 *)
let xor z =
match z with
(false, false) -> false (* 第一个 | 可以省略 *)
| (false, true) -> true
| (true, false) -> true
| (true, true) -> false
;;
(* 类型:val xor : bool * bool -> bool = <fun> *)


let xor x y =
match x,y with
(false, u) -> u (* 在模式中可以使用变量 *)
| (true, u) -> not u
;;
(* 类型:val xor : bool -> bool -> bool = <fun> *)


let f (c:char) : string =
match c with
'0'..'9' -> "digit" (* 可以使用 <字符>..<字符> 字符区间模式 *)
| 'a'..'z' -> "lower char"
| 'A'..'Z' -> "upper char"
| _ -> "other char"
;;
(* val f : char -> string = <fun> *)


let int_of_bool = function (* function 可以直接做模式匹配,函数不带参数 *)
true -> 1
| false -> 0
;;
(* val int_of_bool : bool -> int = <fun> *)

5. 函数

First of all, 函数是变量。

5.1. 简单函数

  • let <fun_name> <参数1> <参数2>...<参数n> = <表达式>

  • let <fun_name> (<参数1>, <参数2>, ...<参数n>) = <表达式>: 将多个参数合并到一个元组中

示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
let add x y =
x + y ;;
(* 类型:val add : int -> int -> int = <fun> *)

print_int (add 1 2) ;; (* 3- : unit = () *)

(* 部分作用/部分求值 *)
let inc x =
add x 1 ;;
(* val inc : int -> int = <fun> *)


(* 将多个参数合并到一个元组中,但这种方式不能部分求值 *)
let plus3 (a, b, c) =
a + b + c ;;
(* val plus3 : int * int * int -> int = <fun> *)

print_int (plus3 (1,2,3)) ;; (* 6- : unit = () *)

5.2. function 和 fun

  • let <fun_name> = function <参数> -> <表达式>: 只能有一个参数,可用于模式匹配

  • let <fun_name> = fun <参数1> <参数2>...<参数n> -> <表达式>: 多参数

5.3. 高阶函数

函数作参和作返回值

5.4. 递归函数

在函数名前添加rec关键字,指定是递归函数。

1
let rec <fun_name> <参数1> <参数2>...<参数n> = <表达式>

示例:

1
2
3
4
5
6
7
(* 普通递归 *)
let rec factorial n =
if n = 0 then
1
else
n * factorial (n-1) ;;
(* val factorial : int -> int = <fun> *)

尾递归实现循环,在参数中加入辅助函数。

1
2
3
4
5
6
7
8
9
10
11
12
13
(* 尾递归实现循环 *)
let fib n =
if n < 3 then
0
else
let rec fib_tail n n_1 n_2 =
if n = 3 then
n_1+n_2
else
fib_tail (n-1) (n_1+n_2) n_1
in fib_tail n 1 1
;;
(* val fib : int -> int = <fun> *)

6. 数据结构

6.1. 类型的显式定义(type)

格式:

1
type [<类型参数>] <类型标识符> = <类型定义表达式>

6.2. 元组类型(tuple)

格式:

<元素1>, <元素2>...<元素n>

每个元素的类型可以不相同。

元组的类型描述为:

<元素1类型> * <元素2类型> *...<元素n类型>

示例:

1
2
3
4
5
6
# let a = "Number", 1;;
val a : string * int = ("Number", 1)
# let b = "pi", 3.14, 5 ;;
val b : string * float * int = ("pi", 3.14, 5)
# let c = 1, (2,3), ((4,5), 6) ;;
val c : int * (int * int) * ((int * int) * int) = (1, (2, 3), ((4, 5), 6))

只有二个元素的元组也称作对偶

函数fstsnd分别取对偶的第一个和第二个分量。

6.3. 记录类型(结构体 record)

定义一个记录类型:

1
type <类型标识符> = { <字段名1>:<类型1>; ... ; <字段名n>:<类型n> }

创建一个记录类型变量:

1
{ <字段名1> = <表达式1>; ... ; <字段名n> = <表达式n> }

访问记录类型中的字段:

1
<记录类型变量>.<字段名>

注意:上述记录类型不可修改!!!

6.4. 联合类型/变体(加强版 union)

格式:

1
2
3
4
type [<多态类型变量>] <类型标识符> =
<构造子名1> [of <参数类型1>]
...
<构造子名n> [of <参数类型n>]

注:构造子名首字母必须大写

6.4.1. 无参构造子(枚举类型)

无参构造子。类似于枚举类型,构造子能和常数或者布尔值一样使用

示例:

1
2
3
4
5
6
7
8
9
10
11
type seasons = Spring | Summer | Autumn | Winter ;;

let int_of_seasons = function
Spring -> 1
| Summer -> 2
| Autumn -> 3
| Winter -> 4
;;
(* val int_of_seasons : seasons -> int = <fun> *)

int_of_seasons Autumn ;; (* - : int = 3 *)

6.4.2. 带参构造子

带参构造子。构造子相当于类型,可以用于定义变量

示例:

1
2
3
4
5
6
7
8
9
10
11
type num = Int of int | Float of float ;;

Int 3 ;; (* - : num = Int 3 *)

let add_num = function
(Int m, Int n) -> Int (m+n)
| (Int m, Float n) -> Float ((float_of_int m) +. n)
| (Float m, Int n) -> Float (m +. (float_of_int n))
| (Float m, Float n) -> Float (m +. n)
;;
(* val add_num : num * num -> num = <fun> *)

6.4.3. 递归类型

示例,定义一个二叉树:

1
2
3
4
type inttree =
Leaf of int
| Node of inttree * inttree (* *号表明是元组类型,不是乘号 *)
;;

6.4.4. 带多态变量的联合类型

6.4.5. 多态变体

6.5. 表(list 不可以修改)

类型描述:

1
<类型> list

6.5.1. 创建

1
[ e1; e2; ... en;]

ei可以是变量或者常量,但类型必须相同。

6.5.2. 添加

头插:

1
2
# 1::[2;3];;
- : int list = [1; 2; 3]

追加:

1
2
3
4
# List.append [1;2] [3;4] ;;
- : int list = [1; 2; 3; 4]
# [1;2] @ [3;4] ;;
- : int list = [1; 2; 3; 4]

6.5.3. 取表头表尾

表头是第一个元素,表尾是除第一个元素外的子表。

1
2
3
4
# List.hd [1;2;3] ;;
- : int = 1
# List.tl [1;2;3] ;;
- : int list = [2; 3]

注意:表中元素也不可以修改!!!

6.6. 汇总

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
OCaml 名字     类型定义的例子                    用法

list int list [1; 2; 3]
tuple int * string (3, "hello")
record type pair = { a = 3; b = "hello" }
{ a: int; b: string }
变体 type foo =
| Int of int Int 3
| Pair of int * string
变体 type sign =
| Positive Positive
| Zero Zero
| Negative
参数化变体 type 'a my_list =
| Empty Cons (1, Cons (2, Empty))
| Cons of 'a * 'a my_list

7. 模块

7.1. 文件即模块

如果有一个util.ml文件:

1
2
3
4
5
(* util.ml *)
let msg = "helloworld" ;;
let printMsg =
print_endline msg
;;

那么,可以在另一个main.ml文件中:

1
print_endline Util.msg ;;

调用Util模块(即util.ml文件)中的变量或者函数。

如果还存在一个util.mli文件,那它就是util.ml模块的接口。未在util.mli中出现的变量或函数,都不能被调用。同时,util.mli文件需要在util.ml文件编译前编译,如下:

1
ocamlc -c util.mli -o util.cmi

7.2. 接口和模块定义

接口定义

1
2
3
4
module type <接口名> =
sig
<接口定义体>
end

<接口名>是一个大写字母开头的标识符,<接口定义体>中包括了 type 定义、函数的类型描述等内容。

模块定义:

1
2
3
4
module <模块名> [:<模块接口>] =
struct
<模块体>
end

<模块名>是一个大写字母开头的标识符,<模块体>中包括了 type 定义和 let 定义。

8. 命令式程序设计

8.1. 可更改变量

定义:

1
let <变量> = ref <表达式> ;;

引用:

1
!<变量>

赋值:

1
<变量> := <表达式>

8.2. 可更改记录

定义:

1
2
3
4
5
type <记录类型> = {
...
mutable <分量名> : <分量类型>;
...
}

赋值:

1
<记录>.<分量> <- <表达式>

8.3. 可修改的数组(Array)

定义:

1
let arr = [|1;2;3|] ;;

访问:

1
<数组>.(<下标>) (* 如:mart.(1).(2) *)

赋值:

1
<数组>.(<下标>) <- <表达式>

常用函数:

1
2
3
4
Array.make 4 1; (* 创建长度为4的一维数组,都初始化为1 *)
Array.make_matrix 2 3 0; (* 创建行为2列为3的二维数组,都初始化为0 *)
Array.length arr; (* 返回数组长度 *)
Array.iter print_int [|1;2;3|]; (* 把一个函数作用于数组每个元素上 *)

8.4. for循环

1
2
3
4
5
for <变量>=<初始表达式> to <终止表达式> do
<表达式1>;
...
<表达式n>;
done