分而治之:Fork/Join框架(构造一个1到200 000求和的任务)

2023-12-23 18:46:41

Fork一词的原始含义是吃饭用的叉子，也有分叉的意思。在linux平台中，
方法fork用来创建子进程。使得系统进程可以多一个执行分组。
而join方法这里表示等待，也就是使用fork方法后系统多了一个执行分支(线程)
所以需要等待这个执行分支执行完毕，才有可能得到最终的结果。因此join方法
就表示等待。
毫无顾忌地使用fork方法开启线程处理，严重影响性能。JDK中，给出了一个ForkJoinPool
线程池。
由于线程池的优化，提交的任务和线程数量并不一一对应的关系。在绝大多数的情况下，
一个物理线程实际上需要处理多个逻辑任务的。因此，每个线程必然需要拥有一个任务队列。
因此在实际执行过程中，可能遇到一种情况：线程A已经把自己的任务都执行完了，而线程
B还有一大堆任务等着处理。

public class CountTask extends RecursiveTask<Long> {
    private static final int THRESHOLD = 10000;
    private long start;
    private long end;

    public CountTask(long start,long end){
        this.start = start;
        this.end = end;
    }

    protected Long compute() {
        long sum = 0;
        boolean canCompute = (end-start)<THRESHOLD;
        if(canCompute){
            for(long i=start;i<end;i++){
                sum +=i;
            }
        } else {
            long step =(start +end)/100;
            ArrayList<CountTask> subTasks = new ArrayList<CountTask>();
            long pos = start;
            for(int i=0;i<100;i++){
                long lastOne = pos+step;
                if(lastOne>end) lastOne = end;
                CountTask subTask = new CountTask(pos,lastOne);
                pos+=step+1;
                subTasks.add(subTask);
                subTask.fork();
            }
            for(CountTask t:subTasks){
                sum+= t.join();
            }
        }
        return sum;
    }


    public  static void main(String[] args) {
        ForkJoinPool forkJoinPool = new ForkJoinPool();
        CountTask task = new CountTask(0,200000L);
        ForkJoinTask<Long> result = forkJoinPool.submit(task);
        try{
            long res = result.get();
            System.out.println("sum="+res);
        }catch (InterruptedException e){
            e.printStackTrace();
        }catch (ExecutionException e){
            e.printStackTrace();
        }

    }
}

构造一个1到200 000求和的任务。
在ForkJoinTask<Long> result = forkJoinPool.submit(task);提交任务给线程池，
线程池会返回一个携带结果的任务，通过get()方法可以得到最终结果。
如果在执行get()方法时任务没有结束，那么主线程就会在get()方法时等待。

CountTask的实现，首先CountTask继承自RecursiveTask类，
可以携带返回值，这里的返回值类型设置为long类型，
THRESHOLD设置了任务分解的规模，也就是如果需要求和的总数大于
THRESHOLD个，那么任务就需要再次分解，否则
就可以直接执行。
如果和我可以直接执行，那么直接进行求和，返回结果。
否则，就对任务再次分解。每次分解时，简单地将原有任务分解成
100个等规模的小任务，并使用fork方法提交子任务。
之后，等待所有的子任务结束，
并将结果再次求和( ?for(CountTask t:subTasks){
? ? ? ? ? ? ? ? sum+= t.join();
? ? ? ? ? ? })

文章来源:https://blog.csdn.net/wcg_jishuo/article/details/135171711
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！