.NET异步程序设计——任务并行库

2.Parallel类

2.0 Parallel类简介

在 System.Threading.Tasks 命名空间下有一个静态类：Parallel类
Parallel可以实现对实现了IEnumerable接口的数据集合的每一个元素并行操作
有一点要说明的：并行操作会带来一定的成本，如果任务本身能很快完成，或是循环次数很少，那么并行处理的速度也许会比非并行处理还慢。
Parallel类就只有有三个方法： Parallel.For() 、 Parallel.ForEach() 和 Parallel.Invoke()
但是呢，这每个方法都有大量的重载（F12-->自行查看Parallel定义）
2.1 Parallel.For()

使用 Parallel.For() 可以对数组中的每一个元素进行 并行操作
正常的遍历数组是按照索引的顺序执行的,但是并行操作，对数组的每一个元素的操作不一定按照索引顺序操作
Parallel.For(),第一个参数是循环开始的索引（包含），第二个参数是循环结束的索引（不含）
Parallel.For()的第三个参数是一个有参数无返回值的委托，其参数是数组的索引
其实就相当于： for (int i = 0; i < length; i++) 的异步版本,只是在这里是并行操作，所以并不按照数组中元素的顺序执行， 具体的执行顺序是不可控的 。
static void Main(string[] args)
    int[] intArray = new int[] { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
    Console.WriteLine("------------常规，对数组进行循环遍历------------");
    Array.ForEach(intArray, n => Console.WriteLine($"当前操作的数组元素是{n}"));//注意这里的参数n是元素而不是索引
    Console.WriteLine("------------并行操作 对数组进行循环遍历------------");
    Parallel.For(0, intArray.Length, (i) => Console.WriteLine($"当前循环次数{i},当前操作的数组元素是{intArray[i]}"));
    Console.ReadKey();
运行结果：可以看出，对数组的元素的操作顺序并不是按照索引的顺序，而是不确定的。
2.2 Parallel.ForEach()
Parallel.ForEach()用于对泛型可枚举对象的元素进行并行操作
其实就相当于：foreach (var item in collection)的异步版本
Parallel.ForEach()有大量的重载，这里展示一个简单的操作
Parallel.ForEach()的第一个参数是待操作的可枚举对象，第二个参数是一个有参数无返回值的委托，该委托参数是集合的元素（而不是索引）
List<int> intList = new List<int>() { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
Parallel.ForEach(intList, n => Console.WriteLine(n+100));
Console.ReadKey();
2.3 Parallel.Invoke()
Parallel.Invoke()对指定一系列操作并行运算
参数是一个Action委托数组(注意只能是Action[],即只能是无返回值的委托数组)
至于怎么使用Parallel.Invoke()执行带参数的委托，见.NET异步程序设计——给线程传递数据
Parallel.Invoke()最常见用于并发请求接口
static void Main(string[] args)
     Action action1=() =>
         for (int i = 0; i < 5; i++)
             Console.WriteLine($"action-1-操作");
     Action action2 = () =>
         for (int i = 0; i < 5; i++)
             Console.WriteLine($"action-2-操作");
     //Parallel.Invoke(action1, action2);
     Action[] actions = { action1, action2 };
     Parallel.Invoke(actions);
     Console.ReadKey();
运行结果：
2.4 补充：线程安全集合
详细可以参考微软的在线文档
多线程对同一个数据集合同时读写操作，可能会造成数据的混乱
.NET4 引入了System.Collections.Concurrent 命名空间，其中包含多个线程安全的数据集合类型。
现在的新项目中，只要是对数据集合进行多线程的增删操作，就应该使用并发集合类。
但是，如果仅从集合进行多线程的读取，则可使用一般的数据集合，即 System.Collections.Generic 命名空间中的类。
.net 中线程安全的数据集合有一下一些：
BlockingCollection
为实现 IProducerConsumerCollection 的所有类型提供限制和阻止功能。 有关详细信息，请参阅 BlockingCollection 概述。
ConcurrentDictionary
键值对字典的线程安全实现。
ConcurrentQueue
FIFO（先进先出）队列的线程安全实现。
ConcurrentStack
LIFO（后进先出）堆栈的线程安全实现。
ConcurrentBag
无序元素集合的线程安全实现。
IProducerConsumerCollection
类型必须实现以在 BlockingCollection 中使用的接口。
一个简单的示例：给一个数据集合添加大批量的数据
List<int> list = new List<int>();
Parallel.For(0, 1000000, t => list.Add(t));
若是按照上面使用Parallel.For()的并行方式给List添加数据，
则会报错：“索引超出了数组界限。”或“ 源数组长度不足。请检查 srcIndex 和长度以及数组的下限。”
即使没有报错，list中的数据也是有问题的（比如：可能数量不足）
当然可以通过加锁的方式进行弥补：
List<int> list = new List<int>();
object locker = new object();
Parallel.For(0, 1000000, t => { lock(locker) { list.Add(t); } });
这样通过对操作的线程枷锁，完全是没有必要的，你可以使用线程安全的集合类型，比如在这里使用ConcurrentBag
ConcurrentBag<int> cBag = new ConcurrentBag<int>();
Parallel.For(0, 100000, t => cBag.Add(t));
当然因为是并行操作，所以插入集合中的数据并不是按照0-100000的顺序（仅仅是成段的有序）。
3.Task类
3.0 Task类简介
System.Threading.Tasks命名空间中Task类，表示异步操作。
Task类可以轻松地在次线程中调用方法，可以作为异步委托的简单替代品。
同时在该命名空间还有一个泛型Task<TResul>类，TResult 表示异步操作执行完成后返回值的类型。
创建一个Task操作，只需要使用静态函数Task.Run()即可，
Task.Run()是一个.net framework4.5及以上定义的一个默认异步操作，
Task.Run()参数是委托，即需要异步执行的方法，
注意作为Task.Run()的参数的委托都是无参委托，
若Task.Run()参数是无返回值的委托Action,则Task.Run()返回值是Task类型
若Task.Run()参数是有返回值的委托Func<TResult>,则Task.Run()返回值是Task<TResult>泛型
注意：若是低于.net4.5，则可以使用Task.Factory.StartNew()，和Task.Run()静态方法效果一样
总而言之，言而总之，show you code ,一切皆明了！
3.1 创建无返回值的Task任务
示例:无返回值的Task
static void Main(string[] args)
    //1.使用Task构造函数创建,必须显式的使用.Start()才能开始执行
    //Task task = new Task(() => { Thread.Sleep(10); Console.WriteLine("我是Task ,我结束了"); });
    //task.Start();
    //2.使用TaskFactory.StartNew（工厂创建） 方法
    //Task task = Task.Factory.StartNew(() => { Thread.Sleep(10); Console.WriteLine("我是Task ,我结束了"); });
    //3.使用Task.Run()
    Task task = Task.Run(() => { Thread.Sleep(10); Console.WriteLine("我是Task.Run ,我结束了"); });
    if (!task.IsCompleted)//task.IsCompleted判断当前的任务是否已完成
        Console.WriteLine("当前的Task.Run()尚未执行完,但是因为异步，返回到调用函数，所以可以先执行后续的代码");
    Console.WriteLine("当前Task.Run还没有完成,我们是在他之后的代码但是先执行了");
    task.Wait();//强行锁定线程，等待task完成
    Console.WriteLine("终于Task.Run完成了工作");
    Console.ReadKey();
3.2 创建有返回值的Task任务
若是Task任务有返回值，返回值类型为Task<T>，使用返回值的Result属性查询具体值
调试时注意查看，运行到 Console.WriteLine(task.Result)的时候，其中Task任务还是在执行Thread.Sleep(1000)
还没有出结果，我们希望的异步执行也没有发生，而是程序是在一直在等待，这是为什么呢？
是因为一但执行了task.Result，即使task任务还没有完成，主线程则停下等待，直到等待task.Result出结果(其实：task.Reulst属性内部会调用task.Wait()方法)
这种情况和异步委托中调用EndInvoke()是一样的：一旦运行EndInvoke，若是引用方法（即异步执行的那个方法）还没有完成，主线程则停止，直到引用函数运行结束。
所以可以这样理解:task.Result可以看作是一个未来结果（一定有结果但还在运算中）
示例：有返回值的Task
static void Main(string[] args)
    Console.WriteLine("SomeDoBeforeTask");
    Func<int> Do = () => { Thread.Sleep(1000); Console.WriteLine("Task.Run结束"); return 2; };
    Task<int> task = Task.Run(Do);
    Console.WriteLine(task.Status);//使用task.Status查看当前的Task的状态：当前的状态：WaitingToRun
    Console.WriteLine(task.Result);//使用task.result操作Task任务的返回值：返回值是：2
    Console.WriteLine(task.Status);//使用task.Status查看当前的Task的状态：当前的状态：RanToComplation
    Console.WriteLine("SomeDoAfterTask");
    Console.ReadKey();
运行结果：
其中我们使用task.Result查看当前的task的状态，其中Task的状态（即其生命周期）：
Created(创建Task)：注意只有Task task=new Task(...),此时的Task状态为Created,其他方式创建的Task跳过了Created状态
WaitingToRun(等待执行Task)
Running(执行Task中)
RanToComplation(Task完成)
当然，TaskStatus枚举类型中还有其他的状态：

Canceled(取消状态) Faulted (失败状态)
3.3 为Task添加延续任务
Task任务是在后台执行的同时，主线程的继续执行后续程序
所以有时候需要在Task结束后，继续执行某个特定的任务，即为Task添加延续任务（也称接续工作）
举一个简单的例子，
求解1-5000能求被3整除的个数，这个过程需要许多时间，我把它定义为一个Task.Run()
我们需要在求出结果后打印出结果，这里怎么操作呢？
若是直接使用task.Result则会阻塞主线程，一直等待运算出结果，这显然不是我们想要的
若是使用while(!task.IsComplation){//后续操作}，你无法判断Task何时结束，而且一旦Task结束则会中断后续操作
这里就是需要为Task加上接续工作
这里你可以明白，接续本质和异步委托中的回调模式是一样的，回调方法就是接续工作
3.3.1使用task.ContinueWith()
task1.ContinueWith(...task2..)表示当task1结束后接着运行task2任务
注意这里我们使用Lambda表达式编写接续工作，接续工作是有一个参数的，参数是Task类型，即上一个Task
即第一个Task完成后自动启动下一个Task，实现Task的延续
注意:ContinueWith()的返回值亦是Task类型对象，即新创建的任务
可以为接续工作task2继续添加接续工作task3
示例5 :
  static void Main(string[] args)
      Console.WriteLine("task执行前...");
      Task<int> task1 = Task.Run(() => Enumerable.Range(1, 5000).Count(n => (n % 3) == 0));
      Task task2 = task1.ContinueWith(t => Console.WriteLine($"当你看到这句话则task1结束了，1-5000中能被3整除的个数{t.Result}"));//这里的t就是task1
      Task task3 = task2.ContinueWith(t => Console.WriteLine($"当你看到这句话则task2也结束了"));
      Console.WriteLine($"task1及其接续工作正在执行中," + "\t\n" + "我们现在正在执行其他的后续代码");
      Console.ReadKey();
运行结果：
3.3.2使用Awaiter
使用task.GetAwaiter()为相关的task创建一个等待者
    static void Main(string[] args)
        Console.WriteLine("task执行前...");
        Task<int> task1 = Task.Run(() => Enumerable.Range(1, 5000).Count(n => (n % 3) == 0));
        var awaiter = task1.GetAwaiter();//创建一个awaiter对象
        //awaiter.OnCompleted(() => Console.WriteLine($"当你看到这句话则task1结束了，1-5000中能被3整除的个{task1.Result}"));
        awaiter.OnCompleted(() => Console.WriteLine($"当你看到这句话则task1结束了，1-5000中能被3整除的个{awaiter.GetResult()}"));
        Console.WriteLine($"task1及其接续工作正在执行中," + "\t\n" + "我们现在正在执行其他的后续代码");
        Console.ReadKey();
运行效果同上。
3.3.3使用ContinueWith和Awaiter的区别
ContinueWith会返回Task对象，它非常适合用于增加更多的接续工作，不过，如果Task出错，必须直接处理AggregateException。
使用task.GetAwaiter创建awaiter对象，是在.net4.5之后，其中C#5.0的异步功能就是使用这种方式。
使用awaiter也是可以使用task.Result直接的查看任务的结果,但是使用awaiter.GetResult()可以在Task出现异常的时候直接抛出,不会封装在AggregateException中。
3.4 Task.Delay
延时执行Task
3.4.1 使用Task.Delay()和ContinueWith实现延迟工作
其实就相当于实现Thread.Sleep()的异步版本
若是你使用Thread.Sleep(),则会程序一直在等待(即阻塞线程)，直到等待结束才会运行后续的代码
而这里就相当于给给Thread.Sleep()一个加了接续工作，且这个接续工作是异步的。
即使用Task.Delay()不会阻塞主线程，主线程可以继续执行后续代码
    //新建异步任务，30毫秒秒后执行
    Task.Delay(30).ContinueWith(c =>
        for (int i = 0; i < 50; i++)
            Console.WriteLine(i + "这是Task在运行");
    for (int i = 0; i < 100; i++)
        Console.WriteLine(i + "这是Task之后的程序在运行");
调试的时候你会发现，刚开始的时候的时候是先显示的"i这是Task之后的程序在运行"
之后在等带了30毫秒，后就会开始显示"i这是Task在运行"和"i这是Task之后的程序在运行"交叉显示
运行结果如下：
3.4.2 使用Task.Delay()和Awaiter实现延迟工作
示例:运行效果同上
    Task.Delay(30).GetAwaiter().OnCompleted(() =>
        for (int i = 0; i < 50; i++)
            Console.WriteLine(i + "这是Awaiter在运行行");
    for (int i = 0; i < 100; i++)
        Console.WriteLine(i + "这是Awaiter之后的程序在运行行");
    Console.ReadKey();    
3.5 Task对象的其他一些静态方法
3.6 取消异步操作
异步方法是可以请求终止运行的，
System.Threading.Tasks命名空间中有两个类是为此目的而设计的：CancellationToken和CancellationTokenSource。
下面看使用CancellationTokenSource和CancellationToken来实现取消某个异步操作。
这里使用Task.Run()为例，其第一个参数是一个Action委托，第二个参数就是CancellationToken对象
static void Main(string[] args)
    CancellationTokenSource cts = new CancellationTokenSource();//生成一个CancellationTokenSource对象，该对象可以创建CancellationToken                                                 
    CancellationToken ct = cts.Token;//获取一个令牌（token)，可以将令牌传递给多个任务，这样可以同时取消多个任务。
    Task.Run(() =>
        for (int i = 0; i < 20; i++)
            if (ct.IsCancellationRequested)
                return;
            Thread.Sleep(1000);
            Console.WriteLine($"异步程序的的循环：{i}");
    }, ct);//注意Run()的第二个参数就是终止令牌token
    for (int i = 0; i < 4; i++)
        Thread.Sleep(1000);
        Console.WriteLine($"主线程中循环：{i}");
    Console.WriteLine("马上sts.Cancel(),即将要终止异步程序");
    cts.Cancel();//含有该CancellationTokenSource的token的异步程序，终止！
    Console.ReadKey();
运行结果：可以发现异步任务Task.Run()还没有完成，但是因为cst.Cancel()运行，token的属性IsCancellationRequested变为true,异步循环结束。
说明：取消一个异步操作的过程，注意，该过程是协同的。
即：调用CancellationTokenSource的Cancel时，它本身并不会执行取消操作。

而是会将CancellationToken的IsCancellationRequested属性设置为true。

包含CancellationToken的代码负责检查该属性，并判断是否需要停止执行并返回。
4.并行Linq（PLinq）
并行Linq 并不属于TPL，但是亦是并行操作，所以总结于此！
4.1 AsParallel()
System.Linq名称空间中有一个ParallelEnumerable类，该类中的方法可以分解Linq查询的工作，使其分布在多个线程上,即实现并行查询。
为并行运行而设计的LINQ查询称为PLINQ查询。
下面让我们先简单的理一理：
首先我们都知道Enumerable类为IEnumberable<T>接口扩展了一系列的静态方法。（就是我们使用Linq方法语法的中用的哪些常用的静态方法，自行F12）
正如MSDN中所说：“ParallelEnumberable是Enumberable的并行等效项”，ParallelEnumberable类则是Enumerable类的并行版本，
F12查看定义可以看到ParallelEnumerable类中几乎所有的方法都是对ParallelQuery<TSource>接口的扩展，
但是，在ParallelEnumberable类有一个重要的例外，AsParallel() 方法还对IEnumerable<T>接口的扩展，并且返回的是一个ParallelQuery<TSource>类型的对象，
所以呢？凡是实现了IEnumberable<T>接口的数据集可以通过调用静态方法AsParallel(),返回一个ParallelQuery类型的对象，之后就可以使用ParallelEnumerable类中的异步版本的静态查询方法了！
注意在运行PLinq的时候，PLinq会自动的判断如果查询能从并行化中受益，则将同时运行。而如果并行执行查询会损害性能，PLINQ将按顺序运行查询。
示例：求1到50000000中可以整除3的数，将所求的结果倒序存放在modThreeIsZero[]中
这是需要非常多的重复运算，所以我们可以对比按照一般Linq查询下方式和PLinq查询，对比一些需要的时间。
static void Main(string[] args)
    int[] intArray = Enumerable.Range(1, 50000000).ToArray();
    Stopwatch sw = new Stopwatch();
    //顺序查询
    sw.Start();
    int[] modThreeIsZero1 = intArray.Select(n => n).Where(n => n % 3 == 0).OrderByDescending(n => n).ToArray();
    sw.Stop();
    Console.WriteLine($"顺序查询，运行时间：{sw.ElapsedMilliseconds}毫秒,可以整除3的个数:{modThreeIsZero1.Count()}");
    //使用AsParallel()实现并行查询
    //AsParallel()方法返回ParallelQuery&lt;TSourc>类型对象。因为返回的类型，所以编译器选择的Select()、Where()等方法是ParallelEnumerable.Where()，而不是Enumerable.Where()。
    sw.Restart();
    int[] modThreeIsZero2 = intArray.AsParallel().Select(n => n).Where(n => n % 3 == 0).OrderByDescending(n => n).ToArray();
    sw.Stop();
    Console.WriteLine($"并行查询，运行时间：{sw.ElapsedMilliseconds}毫秒,可以整除3的个数:{modThreeIsZero2.Count()}");
    Console.ReadKey();
说明：AsParallel()方法返回ParallelQuery<TSourc>类型对象。因为返回的类型，所以编译器选择的Select()、Where()等方法是ParallelEnumerable.Where()，而不是Enumerable.Where()。
运行结果：
可以对比结果，在大规模的Linq查询中，同步查询和并行查询两者的运行时间的差距还是很大的！
但是小规模的Linq查询二者的效果其实并没有很明显。
4.2 取消并行查询
在3.6取消异步操作中解释了如何取消一个长时间的任务，
那么对于长时间运行的PLinq也是可以取消的
同样是使用CancellationTokenSource生成一个CancellationToken对象作为token
怎么把token给PLinq呢？使用ParallelQuery<TSource>中静态方法WithCancellation(token)
在PLinq中，若是取消了并行操作，则会抛出OperationCanceledException
static void Main(string[] args)
    //具体的作用和含义可以看0030取消一个异步操作
    CancellationTokenSource cts = new CancellationTokenSource();
    CancellationToken ct = cts.Token;
    int[] intArray = Enumerable.Range(1, 50000000).ToArray();
    Task<int[]> task = Task.Run(() =>
            int[] modThreeIsZero = intArray.AsParallel().WithCancellation(ct).Select(n => n).Where(n=> n% 3 == 0).OrderByDescending(n => n).ToArray();
            return modThreeIsZero;
        catch (OperationCanceledException ex)//一旦PLinq中取消查询就会触发OperationCanceledException异常
            Console.WriteLine(ex.Message);//注意：Message的内容就是：已取消该操作
            return null;
    Console.WriteLine("取消PLinq?Y/N");
    string input = Console.ReadLine();
    if (input.ToLower().Equals("y"))
        cts.Cancel();//取消并行查询
        Console.WriteLine("取消了PLinq！");//undone:怎么验证已经真的取消了
        Console.WriteLine("Loading……");
        Console.WriteLine(task.Result.Count());
    Console.ReadKey();
5.参考&源代码下载
书籍：精通C#
书籍：C#高级编程
书籍：ASP.NET MVC5网站开发之美
文档：.NET API 浏览器
点击：源代码下载
至此 ，.NET 异步编程中之任务并行库【完】

唉，书真是越看越厚，皆是浅尝辄止！